일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 암호학
- Firewall
- 네트워크
- AWS
- dreamhack
- Java
- vlan
- bastion host
- Repository
- 인공지능
- Reversing
- docker
- 크롤러
- 머신러닝 프로세스
- AI
- CISCO
- 스위치
- Screening Router
- 라우터
- vector
- RIP
- STP
- Python
- 온프레미스
- cmd
- 머신러닝
- abex'crackme
- 자바
- Mac
- 리버싱
- Today
- Total
목록머신러닝 프로세스 (2)
Haekt‘s log
머신러닝을 하는데 있어 필요한 과정이 머신러닝 프로세스이다. 위의 그림은 머신러닝 프로세스로, 가장 기초 부분인 데이터 수집부터 최종 머신러닝 모델의 판단 결과까지 쭉 나열한 그림이다. 아래에서 각 과정을 설명했다. - 데이터 수집 머신러닝에 있어서 가장 중요한 단계이다. 머신러닝 모델을 만드는데 있어 필요한 데이터를 모으는 데이터 수집 부터 시작되기 때문이다. 데이터 베이스에서 수집하거나, 웹 크롤링 등을 통해 데이터를 수집한다. - 특징 공학 이전 과정에서 수집한 데이터를 컴퓨터가 이해할 수 있게 변환하고, 의미있는 부분(특징)을 뽑아내는 단계이다. 이 때의 특징을 attribute 라고 한다 데이터 전처리, 특징추출, 특징 선택의 과정이 이 단계에 포함되어있다. * 데이터 전처리 이전 과정에서 수집..
이 글은 머신러닝 프로세스의 모델링 부분인 DataSet을 다룬다. 때문에 속까지 상세히는 다루지 않고 가볍게 다룰 예정이다. DataSet이란? DataSet이란 방대하게 수집된 데이터로, 머신러닝 프로세스의 모델링과정에서 인공지능을 훈련시킬때 사용된다. 인공지능을 훈련시킬때 사용되는 데이터의 종류에도 여러가지가 있다. 다음과 같다. Trainning Data(훈련 데이터) Validation Data (검증 데이터) Test Data (테스트 데이터) Trainning Data(훈련 데이터) 머신러닝 모델을 만들 때 사용되는 데이터이다. Validation Data (검증 데이터) 훈련 데이터에서 분할된 데이터로, Learning rate 또는 regularization, parameter 등을 튜닝..