목록PYTHON/A.I (9)
정구리의 우주정복
참고한 책 : 지은이 서준석 / 인공지능 보안을 배우다 보안에 관심이 생겨서 한번 공부해보려고 한다 ! 환경은 vmware 과 ubuntu 를 사용한다 vmware 은 이미 설치가 되어있어서 ubuntu 만 다운받으면 된다 releases.ubuntu.com/16.04/ Ubuntu 16.04.7 LTS (Xenial Xerus) Select an image Ubuntu is distributed on two types of images described below. Desktop image The desktop image allows you to try Ubuntu without changing your computer at all, and at your option to install it perma..
자연어 처리 !! 내가 제일 해보고 싶은 분야 텍스트의 토큰화 -텍스트를 잘게 나눈 것 텍스트를 단어 , 문장 , 형태소 별로 나눌 수 있는데 이렇게 나눠진 하나의 단위를 '토큰' 이라고 한다 그리고 잘게 나누는 과정을 '토큰화' 케라스에선 text_to_word_sequence 를 제공해 좀 쉽게 토큰화 할 수 있다 간단한 토큰화 예제 from tensorflow.keras.preprocessing.text import text_to_word_sequence #전처리 할 텍스트 text ='여기는 정구리의 멋진 블로그' #텍스트 토큰화 result = text_to_word_sequence(text) print('원문 :',text) print('토큰화 :',result) #텍스트 전처리 함수 Toke..
데이터 다운로드 www.kaggle.com/kumargh/pimaindiansdiabetescsv?select=pima-indians-diabetes.csv pima-indians-diabetes.csv www.kaggle.com 768명의 인디언으로부터 8개의 속성과1 개의 클래스로 되어있는 csv 파일 1) 데이터 살펴보기 import pandas as pd #names 를 사용해 속성의 키워드를 지정해준다. df = pd.read_csv('파일 경로', names=['pregnant','plasma','pressure','thickness','insulin','BMI','pedigree','age','class']) print(df.head(5)) print(df.info()) #일의 칼럼만 보고싶..
오늘은 폐암 생존률을 분석해볼것이다 2020/10/30 - [PYTHON/A.I] - 인공지능 (1) - 딥러닝 준비운동 인공지능 (1) - 딥러닝 준비운동 *환경은 주피터 노트북을 사용했습니다. '기존 데이터를 이용애 새로운 데이터의 결과를 예측하는 것' 머신러닝은 데이터 안에서 규칙을 발견하고 새로운 데이터에 적용해서 새로운 결과를 도 j-ungry.tistory.com 글에서도 간략하게 분석을 했었지만 이번엔 좀 더 구체적으로 분석해볼것이다. 전체코드 #딥러닝에 필요한 케라스 함수 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense #필요한 라이브러리 불러옴 import numpy as np ..
난 수학 짱 못하는데 딥러닝은 고등학교 수학만으로 원리와 배경을 이해할수 있다니까 도전해봄 기초 수학 함수 : 두 집합사이의 관계를 설명 x 와 y가 있을때 x 가 변하면 이에따라 y가 어떤 규칙으로 변하는지를 나타냄 (y = f(x)) 일차함수 : y가 x 에 관한 일차식으로 표현된 경우 y = ax+b (a != 0) 이때 a 는 기울기 b 는 절편 이라고 한다 이차함수: y가 x에 관한 이차식으로 표현된 경우 y = ax^2 (a != 0) 로 표현 이차함수에서는 최소값을 찾아내는 과정이 매우 중요하다 '최소 제곱법' 공식으로 쉽게 알아낼 수 있지만 실제로 사용할 때는 활용하기 어렵다 따라서 '미분' 과 '기울기' 를 이용해야한다. 미분: 순간 변화율을 구하는 법을 알아야함 ! 미분의 성질 4가지 ..
*환경은 주피터 노트북을 사용했습니다. '기존 데이터를 이용애 새로운 데이터의 결과를 예측하는 것' 머신러닝은 데이터 안에서 규칙을 발견하고 새로운 데이터에 적용해서 새로운 결과를 도출하는 것이다. ex) 수술 환자의 수술 전 상태 , 생존률을 정리해놓은 데이터를 머신러닝에 넣어서 생존률을 구하는 방식 학습 : 데이터가 입력되고 패턴이 분석되는 과정 따라서 얼마나 정확한 경계선(빨간색) 을 긋느냐에 달려있다 ! 폐암 수술 환자의 생존율 예측하기 실제 딥러닝 코드를 이용해 한번 살펴보자 (code 1-1) #딥러닝을 구동하는데 필요한 케라스 함수 호출 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dens..
1. 텐서의 형을 변환하는 Cast import tensorflow as tf #cast 를 써서 데이터의 형을 변환 a1 = tf.constant([[1.1,2,3],[4,5,6]]) #2*3 b1 = tf.constant([[10,11],[20,21],[30,31]]) #c1 = tf.cast(a1,tf.int32) #a1을 int32로 바꿔준다 d1 = tf.cast(b1,tf.float32) print(d1) print(tf.matmul(a1,d1)) a1 은 float32 형이고 b1 은 int32 형이다 이때 cast 를 사용해서 각 tensor 의 형을 바꿔 matmul 을 해보자 ( 형이 다르면 matmul 을 사용할 수 없기 때문에 꼭 형을 맞춰주도록 하자) cast 의 사용 방법 tf...
1. 여러가지 자료형 import tensorflow as tf #여러가지 자료형 string = tf.Variable('This is String',tf.string) #문자열 number = tf.Variable(324,tf.int16) #정수 , 숫자가 하나만 있으니까 스칼라 ,2차원 벡터 floating = tf.Variable(3.567,tf.float64) rank1_tensor = tf.Variable(['Test'],tf.string) #rank1 rank2_tensor = tf.Variable([['Test','ok'],['Test','Yes']]) #rank2 #공식 문서에도 있음 변수를 선언할때는 Variable ,상수를 선언할때는 constant 를 써야한다 자료형에는 string ..