From 9ae05d6df284c7c9e5f923c7a5bc3dfd55cb10b2 Mon Sep 17 00:00:00 2001
From: freylia <162332980+freylia@users.noreply.github.com>
Date: Mon, 25 Nov 2024 04:54:46 +0900
Subject: [PATCH 1/2] =?UTF-8?q?Week=209=5F=EB=B3=B5=EC=8A=B5=EA=B3=BC?=
=?UTF-8?q?=EC=A0=9C=5F=EC=A1=B0=EC=A3=BC=ED=98=84?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
---
...354\241\260\354\243\274\355\230\204.ipynb" | 121 ++++++++++++++++++
1 file changed, 121 insertions(+)
create mode 100644 "Week9_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb"
diff --git "a/Week9_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb" "b/Week9_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb"
new file mode 100644
index 0000000..af4493a
--- /dev/null
+++ "b/Week9_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb"
@@ -0,0 +1,121 @@
+{
+ "cells": [
+ {
+ "cell_type": "code",
+ "execution_count": 1,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "id": "MAyG6GGTU_mC",
+ "outputId": "4855f149-ae2a-4865-b021-8d6c3e47d1fb"
+ },
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Net(\n",
+ " (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))\n",
+ " (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))\n",
+ " (fc1): Linear(in_features=256, out_features=120, bias=True)\n",
+ " (fc2): Linear(in_features=120, out_features=84, bias=True)\n",
+ " (fc3): Linear(in_features=84, out_features=10, bias=True)\n",
+ ")\n"
+ ]
+ }
+ ],
+ "source": [
+ "import torch\n",
+ "from torch.autograd import Variable\n",
+ "import torch.nn as nn\n",
+ "import torch.nn.functional as F\n",
+ "\n",
+ "### 다음은 간단한 Convolutional Neural Network 모델 구조를 나타낸 코드입니다. 6장을 참고하여 아래 코드를 완성해주세요! ###\n",
+ "\n",
+ "class Net(nn.Module):\n",
+ "\n",
+ " def __init__(self):\n",
+ " super(Net, self).__init__()\n",
+ " \n",
+ " # 흑백 이미지(1개 채널)이며, 출력 채널은 6개이고 커널 크기는 5x5\n",
+ " self.conv1 = nn.Conv2d(1, 6, 5)\n",
+ " \n",
+ " # 입력은 ConvLayer의 출력, 출력 채널은 16개이고 커널 크기는 5x5\n",
+ " self.conv2 = nn.Conv2d(6, 16, 5)\n",
+ " \n",
+ " # 입력 크기는 Conv2의 출력 크기를 flatten한 값, 출력 크기는 120\n",
+ " self.fc1 = nn.Linear(16 * 4 * 4, 120)\n",
+ " \n",
+ " # 출력 크기 84\n",
+ " self.fc2 = nn.Linear(120, 84)\n",
+ " \n",
+ " # 출력 크기는 클래스 수(10개)\n",
+ " self.fc3 = nn.Linear(84, 10)\n",
+ " \n",
+ " def forward(self, x):\n",
+ " # (2, 2) 윈도우 크기로 맥스 풀링\n",
+ " \n",
+ " # Conv1 -> ReLU 활성화 -> MaxPooling\n",
+ " x = F.max_pool2d(x, 2) \n",
+ " \n",
+ " # Conv2 -> ReLU 활성화 -> MaxPooling\n",
+ " x = F.max_pool2d(x, 2)\n",
+ " \n",
+ " x = x.view(-1, self.num_flat_features(x))\n",
+ " \n",
+ " # FC1 -> ReLU 활성화\n",
+ " x = F.relu(self.fc1(x))\n",
+ " \n",
+ " # # FC2 -> ReLU 활성화\n",
+ " x = F.relu(self.fc2(x))\n",
+ " \n",
+ " x = self.fc3(x)\n",
+ " return x\n",
+ "\n",
+ "\n",
+ " def num_flat_features(self, x):\n",
+ " size = x.size()[1:] # 배치 차원을 제외한 모든 차원\n",
+ " num_features = 1\n",
+ " for s in size:\n",
+ " num_features *= s\n",
+ " return num_features\n",
+ "\n",
+ "\n",
+ "net = Net()\n",
+ "print(net)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": []
+ }
+ ],
+ "metadata": {
+ "colab": {
+ "provenance": []
+ },
+ "kernelspec": {
+ "display_name": "Python 3 (ipykernel)",
+ "language": "python",
+ "name": "python3"
+ },
+ "language_info": {
+ "codemirror_mode": {
+ "name": "ipython",
+ "version": 3
+ },
+ "file_extension": ".py",
+ "mimetype": "text/x-python",
+ "name": "python",
+ "nbconvert_exporter": "python",
+ "pygments_lexer": "ipython3",
+ "version": "3.11.5"
+ }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
From e5f2e5c5dcdeaabec5e970ff103846ec9f4d7e18 Mon Sep 17 00:00:00 2001
From: freylia <162332980+freylia@users.noreply.github.com>
Date: Tue, 24 Dec 2024 14:54:00 +0900
Subject: [PATCH 2/2] =?UTF-8?q?Week=2013=5F=EB=B3=B5=EC=8A=B5=EA=B3=BC?=
=?UTF-8?q?=EC=A0=9C=5F=EC=A1=B0=EC=A3=BC=ED=98=84?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
---
...354\241\260\354\243\274\355\230\204.ipynb" | 363 ++++++++++++++++++
1 file changed, 363 insertions(+)
create mode 100644 "Week13_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb"
diff --git "a/Week13_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb" "b/Week13_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb"
new file mode 100644
index 0000000..5210040
--- /dev/null
+++ "b/Week13_\353\263\265\354\212\265\352\263\274\354\240\234_\354\241\260\354\243\274\355\230\204.ipynb"
@@ -0,0 +1,363 @@
+{
+ "cells": [
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "# **Description**\n",
+ "- 아래 코드는 **Dropout**과 **Batch Normalization** 기법을 사용하여 Digits 데이터셋에 대해 MLP 모델을 학습하는 코드입니다. \n",
+ "- PyTorch의 `nn.Sequential`을 사용해 모델을 간단히 정의하였습니다.\n",
+ " - 기본 모델 vs dropout 적용 모델 vs dropout + batch normalization 적용 모델의 test 결과 비교를 통해 각 기법의 영향을 알아보고자 합니다. \n",
+ "- 아래 모델 정의 코드 내에 `##답안 코드 작성##` 부분을 채우면서 코드를 실행시켜 주세요!"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "## **데이터 준비**"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 1,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "import torch\n",
+ "from torch import nn, optim\n",
+ "from torch.utils.data import TensorDataset, DataLoader\n",
+ "\n",
+ "from sklearn.datasets import load_digits\n",
+ "from sklearn.model_selection import train_test_split\n",
+ "from tqdm import tqdm\n",
+ "import matplotlib.pyplot as plt"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 2,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "## 데이터를 훈련용과 테스트용으로 분리\n",
+ "# 전체의 20%는 검증용\n",
+ "\n",
+ "digits = load_digits()\n",
+ "\n",
+ "X = digits.data\n",
+ "Y = digits.target\n",
+ "X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.2)\n",
+ "\n",
+ "X_train = torch.tensor(X_train, dtype=torch.float32)\n",
+ "Y_train = torch.tensor(Y_train, dtype=torch.int64)\n",
+ "X_test = torch.tensor(X_test, dtype=torch.float32)\n",
+ "Y_test = torch.tensor(Y_test, dtype=torch.int64)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "## **Dropout** \n",
+ "- **Dropout**은 **과적합 방지**를 위해 훈련 시 일부 노드를 확률 $p$로 무작위로 비활성화하는 기법입니다. \n",
+ " - 비활성화된 노드의 효과는 **스케일링** $\\frac{1}{1-p}$을 통해 살아남은 노드에 보상하여 전체 효과를 유지합니다. \n",
+ "- Dropout의 **훈련 단계**와 **평가 단계**의 작동 방식은 다릅니다. \n",
+ " - **훈련 단계** (`model.train()`): 일부 노드만 활성화되며 다양한 노드 조합을 학습해 **특정 노드 의존도를 줄입니다**. \n",
+ " - **평가 단계** (`model.eval()`): 드롭아웃이 비활성화되어 **모든 노드**가 사용되며, 스케일링도 적용되지 않아 **일관된 출력**을 제공합니다. \n",
+ "> 이를 통해 모델은 **훈련 시 일반화 성능**을 높이고, **평가 시 안정적 결과**를 도출합니다. \n",
+ "\n",
+ " \n",
+ "\n",
+ "(Image Source = https://d2l.ai/_images/dropout2.svg)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 3,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "### 모델링\n",
+ "## 힌트\n",
+ "# 입력층부터 출력층까지 선형층(Linear), ReLU 활성화 함수, 드롭아웃이 반복되는 구조\n",
+ "# 4개의 은닉층이 있으며 각 은닉층은 100개의 노드를 가짐\n",
+ "# dropout 기법으로 50% 확률로 노드를 비활성화함\n",
+ " \n",
+ "\n",
+ "import torch.nn as nn\n",
+ "\n",
+ "model = nn.Sequential(\n",
+ " nn.Linear(64, 100),\n",
+ " nn.ReLU(),\n",
+ " nn.Dropout(0.5),\n",
+ "\n",
+ " nn.Linear(100, 100),\n",
+ " nn.ReLU(),\n",
+ " nn.Dropout(0.5),\n",
+ "\n",
+ " nn.Linear(100, 100),\n",
+ " nn.ReLU(),\n",
+ " nn.Dropout(0.5),\n",
+ "\n",
+ " nn.Linear(100, 100),\n",
+ " nn.ReLU(),\n",
+ " nn.Dropout(0.5),\n",
+ " \n",
+ " nn.Linear(100, 10),\n",
+ ")"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 4,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "### Settings\n",
+ "\n",
+ "ds = TensorDataset(X_train, Y_train)\n",
+ "loader = DataLoader(ds, batch_size=32, shuffle=True)\n",
+ "\n",
+ "lossFunc = nn.CrossEntropyLoss()\n",
+ "optimizer = optim.Adam(model.parameters())"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 5,
+ "metadata": {},
+ "outputs": [
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:38<00:00, 2.62it/s]\n"
+ ]
+ },
+ {
+ "data": {
+ "text/plain": [
+ ""
+ ]
+ },
+ "execution_count": 5,
+ "metadata": {},
+ "output_type": "execute_result"
+ },
+ {
+ "data": {
+ "image/png": "",
+ "text/plain": [
+ "