데이터 라벨링 상담 예약

AI 프로젝트를 위한 고품질 데이터를 활용하세요
특정 요구 사항에 맞는 맞춤형 워크플로
도메인 지식을 갖춘 전문가 어노테이터
정확한 결과를 위한 신뢰할 수 있는 QA
AI 데이터 라벨링을 최적화하려면 지금 상담을 예약하세요 >
상담 예약
블로그로 돌아가기
/
Text Link
This is some text inside of a div block.
/
대화 중: Sapien 영업 책임자 크리스 메이 (Chris May) 가 AV 모델, 데이터 요구 사항 등에 대해 이야기합니다

대화 중: Sapien 영업 책임자 크리스 메이 (Chris May) 가 AV 모델, 데이터 요구 사항 등에 대해 이야기합니다

11.7.2024

Sapien은 창립 이후 AI 산업에서 엄청난 변화를 겪었습니다. 고객은 보다 전문화된 전문 지식을 요구하고 있으며, 분산형 글로벌 라벨러는 이제 Sapien의 플랫폼을 최대한 활용할 수 있습니다.Sapien이 이러한 변화에 어떻게 적응하고 있는지 알아보기 위해 영업 책임자인 크리스 메이 (Chris May) 와 업계의 수요를 주도하는 최신 트렌드에 대해 이야기를 나눴습니다.자율주행차 부문부터 분야별 미세 조정이 필요한 대형 언어 모델 (LLM) 의 등장에 이르기까지, Sapien이 이러한 변화하는 요구 사항을 충족하기 위해 어떻게 포지셔닝하고 있는지 살펴보았습니다.

1.현재 데이터 라벨링 서비스에 대한 수요가 가장 높은 산업은 어디이며, 내년에는 어떻게 변화할 것으로 예상하십니까?

데이터 라벨링에 대한 수요는 확실히 자율주행차 산업에 의해 주도되고 있습니다.이들에게는 시스템 교육을 위해 항상 중앙 집중식 고품질 라벨링 인력이 필요했는데, 이는 결코 사라지지 않을 것입니다.하지만 정말 흥미로운 점은 LLM의 변화입니다.대규모 언어 모델을 개발하는 회사가 점점 더 많아지고 있습니다. 이들은 더 이상 일반 데이터만 찾는 것이 아니라 특정 사용 사례에 맞게 이러한 모델을 미세 조정할 수 있는 도메인 전문가를 필요로 합니다.

따라서 자율 주행 차량이 계속해서 물량 측면에서 우위를 점할 것이지만 특수 라벨링에 대한 수요는 증가할 것이라고 생각합니다.이러한 요구를 충족할 수 있는 유일한 방법은 이러한 수준의 뉘앙스를 제공할 수 있는 검증되고 분산된 전문가 네트워크를 이용하는 것입니다.확실히 흥미진진한 진화입니다.

2.수요가 많은 부문에 서비스를 제공할 때 발견하거나 발견한 구체적인 과제는 무엇이며, 해당 산업의 요구가 판매 전략에 어떤 영향을 미치나요?

우리가 주목하고 있는 큰 변화 중 하나는 지난 10년 동안 광범위하고 방대한 데이터 세트에서 훈련된 모델을 생각하면 많은 범용 AI 모델이 성숙도에 도달하고 있다는 것입니다.광범위한 요구 사항을 충족하는 데는 효과적이지만 기업은 이제 좀 더 정확한 것을 선호하고 있습니다.법률, 의료, 금융 또는 기타 전문 분야를 불문하고 산업별 모델로 전환되고 있습니다.

이는 영업 관점에서 볼 때 AI에 대해 더 이상 광범위하게 이야기할 수 없다는 것을 의미합니다.우리는 이러한 틈새 시장을 깊이 파고들어 이들이 직면하고 있는 특정 문제를 이해해야 합니다.우리의 시장 진출 전략은 점점 더 맞춤형 자료를 구축하고 이러한 고유한 문제를 직접 해결할 수 있는 도구를 개발하는 방향으로 나아가고 있습니다.단순히 솔루션을 판매하는 것이 아니라 우리가 진정으로 고객의 세상을 얻고 변화를 가져올 수 있다는 것을 보여주는 것이 관건입니다.

3.가장 중요한 성장 기회는 어디에 있다고 보십니까?

도메인 전문 지식을 갖춘 모델을 만들기 위한 모델 교육에 기여하는 고도로 숙련된 인력이제 ChatGPT와 같은 도구를 사용하여 퍼블릭 도메인에서 상당히 정확하고 유용한 데이터를 추출하는 결과를 생성할 수 있게 되었습니다.(예: 소고기 웰링턴을 만드는 방법에 대한 단계별 가이드를 제공해 주세요.) 하지만 법률, 의료 및 금융 관련 질문에 대해 LLM이 고도로 숙련된 변호사, 의사 및 금융 전문가와 상담해야만 데이터를 찾을 수 있는 훨씬 더 기술적인 답변에 대해 매우 정확한 답변을 제공할 수 있다면 어떨까요?

4.업계, 특히 자동차 및 데이터 수집과 같은 분야의 주요 트렌드는 무엇입니까?이러한 요구 사항을 충족하기 위해 어떻게 적응하고 계신가요?

데이터 수집은 프로젝트 수 측면에서 Sapien에서 요청한 서비스 중 가장 큰 규모였습니다.기업들은 다양한 억양으로 표현된 다국어, 비즈니스 대화, 음악 및 기타 형태의 데이터와 같은 정교한 입력을 이해할 수 있는 AI 모델을 구축하고 있습니다.

이러한 요구를 충족하기 위해 Sapien은 검증을 위한 기술 평가 시험에 응시하고 자신의 영역 지식을 교육 모델에 적용할 준비가 되어 있는 글로벌 전문가 네트워크를 구축했습니다.

5.데이터 라벨링에 대한 수요가 가장 많이 증가하고 있는 지역 또는 시장은 어디이며, 해당 분야에서 이러한 수요를 주도하는 산업은 어디입니까?

아시아, 특히 중국에서 라벨링 및 데이터 수집 수요가 얼마나 큰지 놀랐습니다.Sapien은 Alibaba, TAL 및 기타 여러 회사와 협력하여 TTS, ASR 및 LLM 미세 조정과 같은 프로젝트를 지원하는 글로벌 전문 기술을 모았습니다.

산업 측면에서 보면 자율 주행은 여전히 가장 큰 업종이지만 웨이크 워크 컬렉션, 이미지 및 오디오 클립 컬렉션과 같은 프로젝트에 대한 많은 요청을 받고 있습니다.

6.정확성이 매우 중요한 분야에서 Sapien은 데이터 레이블링의 속도에 대한 요구와 고품질의 정밀한 주석에 대한 요구 사이에서 어떻게 균형을 맞추고 있을까요?

Sapien 솔루션의 차별화 요소 중 하나는 고객을 위해 라벨링 소프트웨어를 맞춤 설계한다는 것입니다.커스터마이징의 대부분은 태깅 모듈에 자동화를 추가하고 QA 워크플로를 설계하는 데 있습니다.

사전 구축된 모델을 통합하여 태깅을 가속화하고 고객 요구 사항에 따라 데이터를 샘플링하고 검사할 수 있도록 맞춤형 QA 프로세스를 설계할 수 있습니다.

7.현재의 수요를 충족하는 데 있어 자동화와 AI는 어떤 역할을 하며, 데이터 라벨링 프로세스에서 인간의 전문 지식이 여전히 절실히 필요한 부분은 어디입니까?사피엔은 현재와 미래의 이 균형을 어떻게 맞출 수 있을까요?

모델은 점점 더 좋아지고 정확해질 것입니다. 하지만 분야별 전문 지식과 방대한 양의 입력 교육 없이는 불가능합니다.이를 위해서는 수요와 공급 측면의 요구를 모두 충족할 수 있는 솔루션이 필요합니다.

Sapien은 전 세계 기업의 의견을 듣고 있으며 도메인 전문 지식에 대한 수요와 기꺼이 비용을 지불하려는 의향이 있다는 소식을 듣고 있습니다. 공급 측면에서는 전 세계 사람들이 이러한 요구를 충족하는 언어, 법률, 의료 등 전문 지식을 전수하고자 합니다.

사피엔은 두 세계를 Web2 및 Web3 솔루션과 결합할 수 있는 플랫폼을 제공하고 있습니다. 이를 통해 잠재적으로 세계 최대의 AI 생태계를 만들 수 있을 것입니다.

고품질의 정확한 데이터 레이블링에 대한 수요가 증가함에 따라 Sapien은 인간의 전문 지식과 자동화를 결합한 맞춤형 데이터 레이블링 및 데이터 수집 서비스를 제공하는 데 계속 집중하고 있습니다.글로벌 라벨러 네트워크와 게임화된 플랫폼을 통해 급변하는 업계에서 앞서 나가기 위해 데이터의 수요와 공급을 연결하는 생태계를 만드는 데 앞장서고 있습니다.

데이터 라벨링 작동 방식 보기

Sapien의 데이터 라벨링 및 데이터 수집 서비스가 음성-텍스트 AI 모델을 어떻게 발전시킬 수 있는지 알아보려면 당사 팀과 상담을 예약하세요.