반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- DeepLearning
- 데이터전처리
- 빅데이터
- data
- Kaggle
- 오버샘플링
- k-means
- ML
- 공공빅데이터청년인턴
- NLP
- Keras
- 클러스터링
- 머신러닝
- machinelearning
- 2023공빅데
- textmining
- datascience
- 2023공공빅데이터청년인재양성후기
- 데이터분석
- ADsP3과목
- SQL
- decisiontree
- 분석변수처리
- 텍스트마이닝
- DL
- 공공빅데이터청년인재양성
- 공빅데
- 2023공공빅데이터청년인재양성
- ADSP
- 공빅
Archives
- Today
- Total
목록bow (1)
愛林

거의 한 달만에 해보는 텍스트 마이닝 .. 카운트 기반의 문서 표현 컴퓨터는 바보다. 그래서 바로바로 글자를 읽지 못해서, 우리가 숫자로 이루어진 벡터로 바꾸어주어야 안다. 그래서 이전에는 텍스트 전처리를 배웠다. 이렇게 숫자로 이루어진 벡터로 바꾸어주었음에도 불구하고, 우리의 컴퓨터는 맥락을 이해하지 못한다. 전체 글의 맥락을 파악하지 못한다. 전설적, 어휘적, 다변적 사랑이라는 책이 있다. 개념 예술가인 캐런 라이머의 1996년 책인데, 연애 소설 한 편을 골라서 전체 텍스트를 알파벳 순으로 재배열한 책이다. 알파벳 순으로 단어들이 나열된 345쪽짜리 긴 목록이다. X 로 시작하는 단어가 없었기에 25장으로 이루어져있는 책이다. 왜 이런 책을 썼는 지는 모른다. 항상 예술가는 어려운 것 같다. 그러나..
Data Science/Text Mining, 자연어처리
2022. 8. 27. 00:10