김장과 오픈데이터셋의 공통점은?
글쓴이 김혜정 | User Guide Team / 편집 정현주 | Sales, Marketing BXD
🔑 5분 안에 이런 걸 얻을 수 있어요.
- 현재 AI 기업들이 겪고 있는 인공지능 구축 과정의 문제점
- 셀렉트스타가 풀어가고 있는 문제들
김장과 오픈데이터셋.. 공통점은 없어 보인다구요?
단 하나의 공통점도 없어 보이지만 사실 생각보다 비슷한 점이 있습니다. 바로 ‘양질의 재료’를 사용해야 한다는 점인데요.
세계적으로 유명한 AI 4대 천왕 앤드류 응 교수님의 말씀 들어보신 적 있으신가요?
앤드류 응 교수님이 말씀하신 것처럼 인공지능을 만들기 위해서는 인공지능을 학습시킬 수 있는 고품질 데이터가 필요합니다. 데이터 품질이 곧 인공지능의 성능을 결정짓기 때문이죠!
2016년 이세돌과 알파고 대결 기억하시나요? 알파고는 16만 개의 바둑 게임으로부터 약 3천만 수의 데이터를 학습했다고 합니다. 이렇게 똑똑한 인공지능을 만들려면 수천 또는 수십만 개의 데이터가 필요한데요. 하지만 데이터를 모으고 가공하는 데 막대한 비용이 발생합니다. 게다가 오랜 시간이 걸리죠. 그래서 대부분의 AI 기업이 데이터를 구축하는 데 많은 어려움을 겪고 있습니다.
이러한 문제를 타파하고자 우리 본부(a.k.a 셀렉트스타)는 인공지능 개발에 필요한 데이터를 크라우드소싱을 통해 수집 및 레이블링하는 플랫폼 ‘캐시미션’을 운영하고 있습니다. 캐시미션 요원들이 미션을 잘 수행할 수 있도록 서포트하는 동시에 AI 기업에도 도움을 주고 있죠. 이를 통해 궁극적으로는 “데이터를 통해 IT 산업을 발전시켜 세상을 더 편하게 만든다”라는 미션을 수행해나가고 있습니다.
많은 AI 기업이 데이터를 구축하는 데 많은 어려움을 겪고 있는 문제를 해결하기 위해, 셀렉트스타는 인공지능 학습에 활용할 수 있는 데이터를 모아 놓은 데이터셋을 기업에 무료로 지원해주고 있습니다. 셀렉트스타는 앞서 말한 기술을 이용, 데이터를 수집하고 고품질로 가공해서 많은 기업에 지원하고있습니다.
Open Datasets for Data-Centric AI
위 데이터셋은 셀렉트스타 ‘OPEN DATASETS’를 통해 무료로 다운받으실 수 있습니다.
CC BY-SA
복사, 배포 및 재가공 또는 2차 저작물을 만들 수 있으며, 반드시 저작자 및 출처를 표기하고 동일한 라이센스를 적용해야합니다.
https://creativecommons.org/licenses/by-sa/3.0/deed.en