jc.jang

러닝텐서플로 2장 본문

카테고리 없음

러닝텐서플로 2장

jangstory 2018. 6. 2. 01:18
  • Hello World

1
2
3
4
5
6
7
8
import tensorflow as tf
= tf.constant("Hello")
= tf.constant("World")
hw = h+w
with tf.Session() as sess:
    ans = sess.run(hw)
 
print(ans)
cs
텐서플로의 연산 그래프와 관련된 중요한 개념은 먼저 어떤 연산을 할지를 정의해둔 후 외부 매커니즘을 통해서 그 연산을 실행시킨다.

그러므로 h+w는 두 텐서의 합을 구하는 것이아니고, 대신 나중에 실행될 합 연산을 연산 그래프에 추가한다.


Session 객체는 외부의 텐서플로 연산 메커니즘에 대한 인터페이스 역할을 하며, 이를 이용해 우리가 정의한 연산 그래프를 실행한다.



  • MNIST
이미지 처리와 머신러닝에서 가장 많이 다뤄지는 데이터.

  • Softmax Regression
이미지의 위치에 따른 각 픽셀에 해당하는 값이 숫자에 따라 높은지 혹은 낮은지의 경향성을 계산한다. 예를 들어 숫자 '0'과 '6'을 비교해보면 '6'에는 이미지의 가운데에 검은 픽셀이 있다. 만약 어떤 이미지의 가운데에 검은 픽셀이 있다면, 이것은 이 이미지의 숫자가 '0'이 아니고 '6'일 수 있다는 근거가 된다. 소프트맥스 회귀에서는 이미지의 픽셀 배치와 관련된 공간 정보를 사용하지 않는다.

공간 정보를 사용하지 않으므로 이미지의 픽셀을 긴 벡터x로 나타냈을 때, W가중치 벡터와 곱하여 xW로 나타낼 수 있다.
예측은 다음과 같이 한다.
digit = argmax(xW)



import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
#mnist 데이터를 사용한다.
 
DATA_DIR = '/data'
NUM_STEPS = 1000
MINIBATCH_SIZE = 100
 
data = input_data.read_data_sets(DATA_DIR, one_hot=True)
#DATA_DIR에 데이터를 읽는다.
 
= tf.placeholder(tf.float32, [None, 784])
= tf.Variable(tf.zeros([78410]))
#Variable이란 연산 과정에서 조작되는 값인 반면
#placeholder는 연산 그래프가 실행될 때 제공되어야 하는 값이다.
 
y_true = tf.placeholder(tf.float32, [None, 10])
y_pred = tf.matmul(x, W)
#y_true - 정답 레이블과
#y_pred - 예측 레이블에 해당된다.
 
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=y_pred,
                                                                        labels=y_true))
#loss function으로 cross_entropy를 사용하였다.
 
gd_step = tf.train.GradientDescentOptimizer(learning_rate=0.5).minimize(cross_entropy)
#학습 방법으로 경사 하강법을 사용했다.
 
correct_mask = tf.equal(tf.argmax(y_pred, 1), tf.argmax(y_true, 1))
accuracy = tf.reduce_mean(tf.cast(correct_mask, tf.float32))
#argmax 2번째 인자값 0이면 같은 열에서, 1이면 같은 행에서 최대값을 찾는다.
 
 
 
with tf.Session() as sess:
    #학습
    sess.run(tf.global_variables_initializer())
 
    for _ in range(NUM_STEPS):
        batch_xs, batch_ys = data.train.next_batch(MINIBATCH_SIZE)
        sess.run(gd_step, feed_dict={x: batch_xs, y_true: batch_ys})
    #placeholder가 포함된 연산을 수행하고자 할 때마다 placeholder에 값을 밀어 넣는다.
 
    #테스트
    test = sess.run(correct_mask, feed_dict={x: data.test.images, y_true: data.test.labels})
    ans = sess.run(accuracy, feed_dict={x: data.test.images,
                                        y_true: data.test.labels})
 
print("Accuracy: {:.4}%".format(ans*100))
print(test)
cs


Comments