의료용헴프의 생육상태 진단을 위해 학습된 미수정 암꽃
서울--(뉴스와이어)--인공지능(AI) 기반 AI 학습 데이터 구축 전문 기업인 데이터헌트는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2022년 인공지능 학습용 데이터 구축 사업’의 ‘산업용 헴프 생육 이미지 및 환경 데이터’ 구축 사업을 성공적으로 마무리했다고 밝혔다.
‘인공지능 학습용 데이터 구축 사업’은 AI 학습용 데이터의 구축 및 개방을 통해 전 산업에 지능화 혁신 및 성장을 견인하는 사업으로, 고품질 데이터를 대규모로 구축하고 크라우드 소싱을 통한 대규모 일자리 창출을 선도하는 사업이다.
데이터헌트를 주관기관으로 농부심보, 엔에이치엔클라우드, 비투엔, 안동스마트팜사업단(현 재단법인 한국미래농업연구원) 등 총 5개 법인은 이번 사업에서 산업용 헴프 생육 이미지 및 환경 데이터를 구축 완료했다.
‘의료용 대마’로 널리 알려진 헴프는 환각성분(THC)이 0.3% 미만으로 CBD(원료의약품) 성분이 높은 대마를 지칭하며, 산업용 헴프 생육 이미지 및 환경 데이터는 헴프의 재배 과정에서 품질 높은 헴프를 생육하고 적절한 수확 시점을 AI를 통해 자동으로 인식할 수 있도록 하기 위한 목적으로 구축됐다.
이번에 AI 허브를 통해 공개될 데이터 세트에는 헴프의 화아 분화, 암수꽃 개화, 미수정 암꽃의 이미지 데이터와 그에 쌍으로 대응하는 생육 환경 정보 데이터로 구성돼 있다. 해당 데이터 세트는 산업용 헴프의 재배 환경 지능화 및 고도화, 재배 효율 향상 뿐만 아니라, 의료 목적의 헴프 규제 완화에 발맞춰 국내 관련 산업 육성 및 연구 역량 강화에도 기여할 것으로 기대된다.
데이터헌트는 이번 사업을 총괄하며 자체 개발한 AI 기반 데이터 라벨링 플랫폼을 통해 대량의 학습 데이터 가공과 데이터 라벨링 인력 관리를 성공적으로 수행했다.
데이터헌트 민병준 매니저는 “이번 사업은 경상북도 안동시에 마련된 헴프 규제 자유 특구에서 자체 수집된 원시 데이터를 활용했다는 점에서 그 의미가 더욱 크다”며 “국내 최고 수준의 데이터 및 AI 기술 기업과 품질 검증 기업이 철저한 품질 관리 및 검사를 거쳐 완성도 높은 데이터 세트를 구축했으며, 아직 초기 단계인 국내 헴프 산업 발전과 디지털화의 마중물 역할을 할 것으로 기대한다”고 밝혔다.
한편 데이터헌트는 이번 산업용 헴프 생육 이미지 및 환경 데이터 사업 외에도 3개의 ‘인공지능 학습용 데이터 구축 사업’에 참여해 AI 데이터 구축 역량과 경쟁력을 입증했다.
데이터헌트 소개
데이터헌트(DataHunt)는 인공지능(AI) 기반 데이터 수집/가공 기업으로 AI 기반 데이터 크라우드 소싱 플랫폼을 운영하고 있다. 글로벌 데이터 분석 기업 피스컬노트(FiscalNote)가 투자한 기업으로, 한앤컴퍼니, 네이버, 카카오, 삼성 국내외 유수 기업 출신 엔지니어들이 근무하고 있다. 피스컬노트의 기술력을 결합해 데이터 전처리부터 검수, 인력 관리에 이르기까지 AI 기반 크라우드 소싱 플랫폼 서비스를 제공하고 있다. 국내에서는 NHN주식회사, 위메프, KAIST, 스탠더드앤드푸어스(S&P) 글로벌을 비롯한 기업, 기관들과 협업했다. 자세한 사항은 데이터헌트 웹사이트에서 확인할 수 있다.