상냥체로 하면 한남으로 바꿔버림
진짜조켓다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
레전드네 진짜 ㅋㅋㅋㅋㅋ
ㅋㅋㅋㅅㅂ 머고진짜
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
임금님 뚝심봐
이런걸 검색한 당신들 !! 한남이 분명해 주거!! 이렇게 만든걸까
ㅋㅋㅋㅋ 한남 못 잃어서 모든곳에 넣을커야
왜 저럴까 .. 나라 ㅈ망했다
ㅋㅋㅋㅋㅋㅋㅋ에휴
스윗하긴하네 ㅋㅋㅋ
진짜 애미씨발 대놓고 쳐넣었네 ㅋㅋㅋㅋㅋㅋㅋ
하긴… 남자들 중에서 한녀라고 쓰는 사람이 없긴해
그래서 데이터 수집이 불가능했겠지
안쓰긴하지 ㅋㅋ
ㅋㅋㅋ 에휴
의도적으로 넣은거 맞지 카카오면ㅋㅋ 남혐 심하게 하던데 검열할때
AI라니까....데이터 학습 잘못한 건데. 아니, 전처리는 무조건인데 stopword로 걸러도 되고.....말이 안 된다. 진짜. 아무리 옹호하려고 해도 저게 말이 되나.
AI겠냐?ㅋㅋㅋㅋㅋ 의도적으로 바꿔치기 하는건데ㅋㅋㅋㅋㅋㅋ
애미씹ㅋㅋㅋㅋㅋㅋ
아주 장작에 기름까지 ㅋㅋㅋ
나라에서 넣어주는 걸로도 부족해서
사기업까지 엘리전을 응원하다니 가슴이 웅장해진다
이제 좀 피로하다 아무생각 안하고 싶다
학습한 카톡대화 자료에 한남이 압도적이었나보지 ㅋㅋㅋㅋ
이런거 나올때마다 여자 개붕이들은 뭐함?
아무생각 안드나?
저거 옆에 진짜 조케따는 뭐냐
이모티콘플러스라고 단어나 문맥에맞는 이모지 자동으로 추천해주는 기능 있음..
미친새끼들ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
?
자연어 관련해서 현업은 아니지만 대학원 다닐 때 시도해본게 단어 단위가 아니라 문장 단위로 학습 데이터 만드는 거였음.
나는 밥을 먹었다.
[나,는,밥,을,먹,었다]
라고 형태소 단위로 찢어서 학습시키고 규칙을 따로 학습 시켜서 “나는 밥을 먹었다.”를 만들었는데
그 과정을 거치는 것보다. 그냥 입력 값에 대한 통문장을 출력하게 만드는 방식이라고 생각하면 됨.
그러다 보니깐 저런 결과가 나온 듯.
그와중에 위에 stop word라고 불용어나 욕설같은 애들 학습 못시키게 막는게 있는데
“한녀” 같은 경우에 설정되어 있지만 “한남”은 지역 때문에 따로 설정 안한 것 같음. 그래서 이거 솔직히 나는 욕 못하겠다. 그냥 웃어줬으면 좋겠음.
설명이 너무 복잡해서 그런데..
진짜로 NLP 논문들이 한국어 적용하기 빡세서 나오는 현상이라고만 이해해줘.
아마 문장 치환 같은 경우에는 좌표상에 가장 가까운 거리에 있는 문장으로 바꿔주는 것 같은데.
(한녀)는 불용어라서 해당 문장 자체가 사라지는 것 같고 (한남)은 불용어가 아니라서 그냥 사용된 것 같음. 이건 위에 말한 한남동 때문에 어쩔 수 없음.
머신러닝쪽은 잘 몰라서 그랬는데 한남/동 같은 지역명이나 한남/대교 같은 건물명땜에 한남은 예외처리가 안된거구나
한녀는 통상적으로 사용하는 단어가 아니니까 예외될 수밖에 없고
안웃김
당장 구글이나 빙AI에 한남 뒤져라고 쳐보자. 그냥 카카오가 AI쪽에 무능하고 검색엔진 아무도 안써서 데이터셋도 처참함
ㅇㅇ 그걸로 욕하는건 맞음.
실력이 부족해서 나온 결과물임..
진짜 은근슬쩍 스리슬쩍 사기업에서도 혐오짓을 대놓고 하네ㅋㅋㅋ 오늘은 카카오 야근이야?
야근각이긴 한데 고의적 혐오는 아니야..
그냥 실력 부족으로 나온 결과물임.
고의적맞아 한녀 죽어-> 한남님 실례지만 그런 말씀 하셔도 괜찮을까요? 라고 나옴
??? : 그래서 카톡 안쓸꺼야?
패블릿
아도니스
진짜조켓다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
왕십리마조로
레전드네 진짜 ㅋㅋㅋㅋㅋ
유지민
ㅋㅋㅋㅅㅂ 머고진짜
데스데스
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
필수
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
집택과선중
임금님 뚝심봐
케켈운동
이런걸 검색한 당신들 !! 한남이 분명해 주거!! 이렇게 만든걸까
감정피지배자
ㅋㅋㅋㅋ 한남 못 잃어서 모든곳에 넣을커야
정통추
왜 저럴까 .. 나라 ㅈ망했다
위행위자
ㅋㅋㅋㅋㅋㅋㅋ에휴
YAGOO
스윗하긴하네 ㅋㅋㅋ
NMNSe
진짜 애미씨발 대놓고 쳐넣었네 ㅋㅋㅋㅋㅋㅋㅋ
와르르
하긴… 남자들 중에서 한녀라고 쓰는 사람이 없긴해
그래서 데이터 수집이 불가능했겠지
개인정비때개드립함
안쓰긴하지 ㅋㅋ
한빛
ㅋㅋㅋ 에휴
은쩍슬쩍
의도적으로 넣은거 맞지 카카오면ㅋㅋ 남혐 심하게 하던데 검열할때
바바밥
AI라니까....데이터 학습 잘못한 건데. 아니, 전처리는 무조건인데 stopword로 걸러도 되고.....말이 안 된다. 진짜. 아무리 옹호하려고 해도 저게 말이 되나.
메리어스
AI겠냐?ㅋㅋㅋㅋㅋ 의도적으로 바꿔치기 하는건데ㅋㅋㅋㅋㅋㅋ
애미씹ㅋㅋㅋㅋㅋㅋ
기여운걸조아하는사람
미식실장
아주 장작에 기름까지 ㅋㅋㅋ
나라에서 넣어주는 걸로도 부족해서
사기업까지 엘리전을 응원하다니 가슴이 웅장해진다
나라사랑
이제 좀 피로하다 아무생각 안하고 싶다
가베라
학습한 카톡대화 자료에 한남이 압도적이었나보지 ㅋㅋㅋㅋ
두유라떼
이런거 나올때마다 여자 개붕이들은 뭐함?
아무생각 안드나?
그런생각합니다
저거 옆에 진짜 조케따는 뭐냐
스무숲사거리
이모티콘플러스라고 단어나 문맥에맞는 이모지 자동으로 추천해주는 기능 있음..
벼랑위의분뇨
미친새끼들ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
연골어류
?
하니팜
자연어 관련해서 현업은 아니지만 대학원 다닐 때 시도해본게 단어 단위가 아니라 문장 단위로 학습 데이터 만드는 거였음.
나는 밥을 먹었다.
[나,는,밥,을,먹,었다]
라고 형태소 단위로 찢어서 학습시키고 규칙을 따로 학습 시켜서 “나는 밥을 먹었다.”를 만들었는데
그 과정을 거치는 것보다. 그냥 입력 값에 대한 통문장을 출력하게 만드는 방식이라고 생각하면 됨.
그러다 보니깐 저런 결과가 나온 듯.
그와중에 위에 stop word라고 불용어나 욕설같은 애들 학습 못시키게 막는게 있는데
“한녀” 같은 경우에 설정되어 있지만 “한남”은 지역 때문에 따로 설정 안한 것 같음. 그래서 이거 솔직히 나는 욕 못하겠다. 그냥 웃어줬으면 좋겠음.
하니팜
설명이 너무 복잡해서 그런데..
진짜로 NLP 논문들이 한국어 적용하기 빡세서 나오는 현상이라고만 이해해줘.
아마 문장 치환 같은 경우에는 좌표상에 가장 가까운 거리에 있는 문장으로 바꿔주는 것 같은데.
(한녀)는 불용어라서 해당 문장 자체가 사라지는 것 같고 (한남)은 불용어가 아니라서 그냥 사용된 것 같음. 이건 위에 말한 한남동 때문에 어쩔 수 없음.
초코맛피클
머신러닝쪽은 잘 몰라서 그랬는데 한남/동 같은 지역명이나 한남/대교 같은 건물명땜에 한남은 예외처리가 안된거구나
한녀는 통상적으로 사용하는 단어가 아니니까 예외될 수밖에 없고
lIllIIlIIll
안웃김
필수
당장 구글이나 빙AI에 한남 뒤져라고 쳐보자. 그냥 카카오가 AI쪽에 무능하고 검색엔진 아무도 안써서 데이터셋도 처참함
하니팜
ㅇㅇ 그걸로 욕하는건 맞음.
실력이 부족해서 나온 결과물임..
Ultragear
진짜 은근슬쩍 스리슬쩍 사기업에서도 혐오짓을 대놓고 하네ㅋㅋㅋ 오늘은 카카오 야근이야?
하니팜
야근각이긴 한데 고의적 혐오는 아니야..
그냥 실력 부족으로 나온 결과물임.
으하하핳
고의적맞아 한녀 죽어-> 한남님 실례지만 그런 말씀 하셔도 괜찮을까요? 라고 나옴
빰바라빤쮸
??? : 그래서 카톡 안쓸꺼야?