본문 바로가기

분류 전체보기117

[YouTube] 하와이 대저택. "이렇게 하는 겁니다. 무의식 바꾸기 EP01" 상상을 현실화 하는법 원하는 걸 명확히 알아야한다. 원하는 것을 한 문장으로 만들어 소리내어 말하기. 하루에 100번, 문장은 구체적으로 정확한 연도 표시 그리고 과거형으로 손으로 적기 원하는 모습을 상상으로 시각화 하기 내가 정말 원하는 것인지 의심하자. 주변과 비교해서 '나도 이 정도는 되어야겠다.' 또는 부모님의 기대에 부응하기 위해 이런 거는 내가 정말 원하는 게 아니다. 그러면 정말 원하는 것을 찾는 법은 무엇일까. 첫 번째는 그거 이미 이뤘을 때를 상상하기. 상상을 구체적으로 해보자. 어느 지역에서 어떤 핸드폰을 쓰고 어떤 집에 있고 어떤 옷을 입고 어디로 출근하는지 출근할 때 주변 사람들의 얼굴까지도 상상하자. 이런 상상을 했을 때 특별히 별 감정이 들지 않는지 내가 들뜨고 설레는지 스스로 .. 2022. 12. 10.
[포럼] if(kakao)dev2022 "메일 카테고리 분류 모델 개발기" 데이터 전처리 각 카데고리별로 동일한 양을 넣어주어야하는 것은 자명 한 카테고리 내에서 균형있는 메일의 양 또한 중요한 문제 이말을 듣고 내가 잘못하고 있었구나 느꼈다. 내 피처는 86가지정도 되는데 얘네들이 동일한 양인지는 생각 안했다. 즉 한 피처의 양이 데이터에 대부분이라면 모델 학습시 정확도가 떨어지는 아웃풋을 내놓는다는 것이다. 그래서 내가 계속 정확도가 떨어지는 결과를 받아왔나 보다. 발표자는 이를 데이터를 균등히 조절하여 학습을 시켰다고 했다. 검증 이전 실험에 관한 글에서도 보면 AB테스트를 했다. 기존 모델과 만들어진 모델의 정확도를 비교하는 작업이다. 여기서 눈이 갔던 포인트는 검증의 결과를 시각화였다. 수치를 표에 넣어 차이를 보여주기 보다 파이 그래프를 활용했다. 수치로 보여 줄 것.. 2022. 12. 8.
[포럼] if(kakao)dev2022 "실험을 잘한다는 것은 무엇일까?" 머신러닝 기술을 활용하여 비즈니스 문제를 해결하는 과정에는 많은 실험이 필요합니다. 그동안 실험하면서 시행 착오를 겪었던 것들, 중요하다고 생각한 것에 대해 공유드릴게요. "실험 결과를 어떻게 남겨야 다음 실험에 도움이 될 수 있을까요?" Answer "실험에는 승부수가 있어야합니다. 이 실험이 성공할거라고 생각하는 이유 " 단순히 성능이 좋다고 입증된 논문을 가지고 실험을 한다면, 실패 했을때 피드백을 정확하게 받을 수 없다. 스스로 가설을 세워 가설을 입증을 위한 실험으로 접근하는 것이 효율적이다. 여기서 발표자는 "문제해결의 핵심이 되는 특징, Key Feature","문제환경, Environment" 이 두가지 키워드를 꼽는다. 이것을 가지고 승부수(논리)를 만들어 실험을 진행하면 다음 실험에 도.. 2022. 12. 8.
[책] LUCKY DRAW 럭키 드로우. 기억에 남는 순간 part 1 나만의 길을 찾을 때까지 인생의 레버를 당기는법 "앤드류, 너의 꿈은 뭐야?" 가끔씩 나 자신과 대화를 이어나가면서, 실제로 말을 하면서 대화를 이어나가 그 끝엔 내가 원하는 모습이 되어 꿈꾸는 생활을 상상하곤 한다. 에이 뭐 상상이지 하면서 수 많은 인생의 레버들을 당길 기회를 내가 져버렸다. 그래도 지금이라도 깨달은게 행운이다 싶다. 블로그 시작이라는 레버를 당겼고, 책을 읽는 레버를 당김으로써 이러한 나를 돌아보는 시간을 얻었으니까. "회사가 내게 큰 기대를 갖지 않았기 때문에 오히려 부담 없이 다양한 일을 맡아 도전해볼 수 있었던 것 같다." 이러한 기회가 있다면 주저없이 레버를 힘차게 당길거다. 예전 경험을 비추어 봤을 때도 나는 힘차게 레버를 당겼다. 축제 부스 한 칸 안에서 내가 원하는 행사.. 2022. 12. 7.
[자연어 처리] Do it! BERT 와 GPT로 배우는 자연어처리 요 1-1 딥러닝 기반 자연어 처리 모델 모델의 출력은 0과1사이에 확률이다. 아웃풋으로 나온 확률 값을 활용하여 후처리(레이어추가?)하여 자연어 형태로 가공 반환. 2번을 하는 이유는 문서 분류, 문장 쌍 분류, 개체명 인식, 질의응답, 문장생성 등의 과제를 해결하기 위함. 학습데이터에는 문장과 레이블(라벨)이 쌍으로 구성됨. 학습시 모델의 출력값이 레이블 값과 가까우도록 업데이트 함. 1-2 트랜스퍼 러닝 트랜스퍼 러닝(transfer learning) : 특정 테스크를 학습한 모델을 다른 테스크 수행에 재사용 하는 기법. 1번을 비유를 하면 경험을 재활용한다는 의미. 특정 태스크(과제)를 학습한 모델을 다른 태스크 수행에 재사용하는 기법. 업스트림(upstream) : 문장의 다음 단어 맞히기, 빈칸 .. 2022. 12. 7.
[파이썬 시각화] 워드클라우드(wordcloud) 활용 '금리' 라는 키워드를 가진 뉴스 제목을 수집하여 워드클라우드로 시각화 해보기. 데이터 수집 방법이 궁금하다면. 링크 참고. # 데이터 수집 생략 # 필요 라이브러리 from collections import Counter from wordcloud import WordCloud import matplotlib.pyplot as plt from konlpy.tag import * okt = Okt() data = '수집된 데이터' nouns_sen = []# 기사제목 당 명사만을 담을 리스트 for sen in data: nouns_sen.extend(okt.nouns(sen)) count = Counter(nouns_sen).most_common(20)# 가장 빈도가 높은 명사들을 20개만 추려보기. .. 2022. 11. 28.
728x90