이루다가 내뱉은 혐오발언, AI가 학습한 게 아니다
비트팩토리사랑점2
0
99
2021.07.04 14:38
(생략)
지금까지 학계에서는 ‘이루다’의 혐오 발언은 잘못된 데이터를 학습한 AI가 편향성을 가중한 것(지어낸 것)으로 봤다. 즉 AI라도 혐오발언을 내밷을 수 있다며 알고리즘 문제까지 제기하는 사람도 있었다.
그러나 개인정보보호위에 따르면 이루다는 20대 여성의 카카오톡 대화문장 약 1억건을 응답 데이터베이스(DB)로 구축하고, 이루다가 이 중 한 문장을 선택해 발화할 수 있도록 운영했다.
즉 테이처럼 AI가 학습해 스스로 평가를 가중하고 혐오발언을 만들어낸 게 아니고, 현실세계에서 존재하는 카카오톡 대화 1억건 중 하나를 뽑아내는 일만 했다는 의미다.
(생략)
http://n.news.naver.com/mnews/article/018/0004914768?sid=105
(생략)
스캐터랩은 이루다 개발을 위한 알고리즘 학습 과정에서 자사 앱 ‘텍스트앳’과 ‘연애의 과학’을 통해 수집한 이용자 약 60만명의 카카오톡 대화 문장 94억여건을 이용한 것으로 확인됐다.
(생략)
이 밖에도 개인정보위는 ▲법정대리인의 동의 없이 만 14세 미만 아동의 개인정보를 수집한 행위, ▲성생활 등에 관한 정보를 처리하면서 별도의 동의를 받지 않은 행위, ▲탈퇴한 회원의 개인정보를 파기하지 않은 행위, ▲1년 이상 서비스 미사용자의 개인정보를 파기하지 않은 행위 등도 모두 개인정보보호법 위반이라고 판단했다.
(생략)