(원본 제목: 스피치 공동 설립자 겸 수석 과학자 유카이: ChatGPT 는 알파고에 이어 가장 큰 이정표 진보 | 재와의 인터뷰)
이번 인터뷰 대상자:
스피치 공동 창립자 겸 수석 과학자 유카이
"GPT 는 대화 지능 기술, 심도 있는 학습 대형 모델 기술, 엔지니어링 능력, 빅 데이터의 전반적인 돌파구를 포함한 인공 지능 개발의 중앙 집중식 돌파구입니다."
○개인 소개
스피치 공동 창립자 겸 수석 과학자, 상하이 교통대 교수.
청화대 학부 석사 캠브리지 대학 박사.
국가급 중대 인재공사에 입선되어 상해시의’ 동방학자’ 특임교수로 뽑혔다.
Ieee speech and language processing technical Committee 위원 (2017-2019), 중국 컴퓨터학회 음성대화 및 청각전문위원회 부주임, 중국 인공지능산업개발연맹 학술 및 지적재산권 팀장. 세계 최고의 과학자 포럼 (World Laureates Forum) 청년 과학자 위원회 위원, 전국 신호위 사용자 인터페이스 분위원회 위원.
200 여 편의 국제논문을 발표하고, 여러 국제연구챌린지 챔피언을 획득하고, 인터페이퍼의 공식 홈페이지를 다운로드하는 방법은 어느 Speech, ICMI 등 국제회의절차위원회 의장과 ACL, NAACL, EMNLP 등 국제회의대화상호 분야 의장을 맡고 있다.
중국 인공지능학회 오문준 인공지능과학진보상, 중국컴퓨터학회 청죽상, 2016 년’ 과학중국인’ 올해의 인물을 수상했다.
○첫 번째 태그
인공지능 분야의 발전을 이끄는 장기주의자
○회사 소개
Shi Bichi 는 자체 개발 된 전체 링크 지능형 대화 시스템 맞춤형 개발 플랫폼 및 인공 지능형 음성 칩을 기반으로 "클라우드+코어" 레이아웃, 하드웨어 및 소프트웨어 결합 인공 지능 기술 및 제품 서비스 제공, 지능형 가전 제품, 스마트 자동차, 소비자 전자 및 기타 인터넷 분야 및 디지털 정부 기업 분야에서 지능형 인간-컴퓨터 상호 작용 소프트웨어 제품, 하드웨어 통합 인공 지능 제품 및 대화 형 인공 지능 기술 서비스를 제공합니다. 지금까지, 스피치는 거의 100 개의 글로벌 독창적인 기술을 보유하고 있으며, 지적 재산권은 거의 1400 건에 달하는 허가를 받았으며, 그 중 700 건에 가까운 특허, 약 400 건에 가까운 소프트웨어 저작권, 50 개에 가까운 국가/단체 표준에 앞장서고 있습니다.
2022 년 11 월 30 일 온라인에 올라온 인공지능 채팅 로봇 모델 ChatGPT 는 최근 전 세계적으로 2 개월 만에 월활이 수억을 돌파했다. ChatGPT 의 출환과 함께 해외 과학기술 거물인 마이크로소프트 구글이 AI 검색대전을 벌일 뿐만 아니라 국내에는 바이두 알리 텐센트 화웨이 징둥, 넷이 등 대형 공장을 포함한 많은 과학기술회사들이 관련 방향의 연구개발 진척을 공개했다.
국내 전문 대화식 인공지능 플랫폼형 기업은 음성 신호 처리, 인식, 합성, 언어 이해, 문답채팅, 지식지도 등 인간-기계 정보 상호 작용과 관련된 각 모듈급 기술을 숙지했습니다. 사용자 의도와 감정을 감지하고 사용자 초상화를 기반으로 의인화된 언어 스타일 상호 작용을 실현할 수 있습니다.
최근 스피치 공동 설립자 겸 수석 과학자 유카이는 기자와의 인터뷰를 통해 ChatGPT 대화 로봇에 대한 시필치의 연구 개발 진전, ChatGPT 가 업계에 미치는 의미, 국내외 플레이어 격차, 생성식 AI 가 직면한 도전 등에 대해 공유했다.
Q: ChatGPT 와 같은 대화 로봇 개발에 있어서 회사는 현재 어떤 진전을 보이고 있습니까?세계 랭킹 1 위오피스타공식 홈페이지는 무엇입니까?
유카이: 기술의 반복 발전에서 ChatGPT 의 본질은 통계류의 심도 있는 학습 대화의 일반적인 모델이다.
사필치는 국내 최초로 통계류 대화 모델의 산업화 연구를 진행한 회사 중 하나이며, 임무형 대화에서도 많은 좋은 연구 성적과 응용 성적을 거뒀다고 할 수 있다. (윌리엄 셰익스피어, 스튜어트, 자기관리명언) 이미 가지고 있는 음성과 의미의 공통된 기본 모델은 이미 억급 매개변수에 도달했다.
범용 기본 모델 기술의 경우, 현재 사필종이 항공기 공식 웹사이트가 어떻게 수천 개의 GPU 카드 분량의 하이퍼컴퓨팅 자원을 이용하고 있으며, 확장 자원을 통합하고 있으며, 기존 알고리즘 연구와 데이터 축적을 바탕으로 억급 매개변수 모델을 100 억 개 이상의 규모로 확장하고 있습니다.
Q: ChatGPT 와 같은 대화 로봇 개발에 대한 회사의 미래 계획은 무엇입니까?
유카이: 지금의 ChatGPT 는 여전히 텍스트 로봇으로 등장합니다. 시작일 뿐, 미래에는 음성대화 로봇으로 진보할 것이며, 음성과 텍스트의 심도 있는 융합을 점차 강화할 것이라고 믿습니다. 청각 인식 기술 방면에서, 스피치는 정밀한 음성 전환과 고품질의 음성 방송 효과를 실현할 수 있다. 인간-컴퓨터 상호 작용 과정에서 직면 한 장거리, 복잡한 음장의 다중 소음 간섭 및 다중 스피커 판단을 해결할 수 있습니다. 사용자의 방언, 외국어에 대한 인식 및 합성에 대한 요구를 만족시키다.
채팅 로봇 방향에서도 음성, 텍스트, 이미지 신호를 융합하는 멀티 모달 상호 작용 기술도 큰 기회가 있다. 현재의 새로운 가상 디지털 사례를 예로 들자면, 멀티 모달, 지능적이고 완벽한 솔루션은 서로 다른 장면의 복잡한 변화에 더 잘 대처할 수 있으며, 멀티 모달 상호 작용은 산업 발전의 필연적인 추세가 될 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 예술명언) 멀티 모달 및 상호 작용 기술 방향에서 스피치 (Sibicci) 는 업계 최초로 전이중 대화 아키텍처를 발표하여 독특한 폐쇄 루프 인간-기계 대화 시스템 구축의 기본 종합 기술 우위를 형성하고 있으며, 국제 주류 선진 기술에 비해 성문 검증, 음성 분리 등의 지표가 눈에 띄게 향상되었다.
Q: 이번 ChatGPT 화재 동그라미에 대해 어떻게 생각하세요? 가능한 원인은 무엇입니까?
유카이: ChatGPT 는 알파고에 이어 가장 큰 이정표 진보라고 할 수 있어요. 알파고는 규칙 상황을 결정하는 검색과 처리를 해결하는 반면, GPT 는 구문 규칙이 정해지지 않은 상태에서 자연어 상호 작용 문제를 부분적으로 해결했다. 우리는 GPT 를 특정 포인트 기술의 돌파구로 간단히 이해할 수는 없지만, 대화 지능 기술, 심도 있는 학습 대형 모델 기술, 엔지니어링 능력, 빅 데이터의 전반적인 돌파구를 포함한 인공 지능 개발의 중앙 집중식 돌파구입니다.
ChatGPT 가 불난 또 다른 이유는 산업응용 수요가 기술의 부름에 응답했다는 것이다. 각종 스마트 하드웨어가 발전함에 따라 기능적으로는 점점 동질화되고 있으며, 경험상 자신의 특색을 만들기도 어렵다. ChatGPT 의 창작 능력은 산업 앱급의 요구를 만족시켜 새로운 공간을 열었다.
Q: 로이터 기자에 따르면 AI, 생성식 AI, 기계학습 등의 단어가 미국 과학기술 거물의 최신 시즌 재보 회의에 나오는 빈도는 지난 분기의 2 ~ 6 배에 달한다. 거물들이 잇달아 생성식 AI 를 발동하는데, 어떤 이유가 있다고 생각하십니까?
유카이: 본질적으로 생성식 AI 가 착지 적용 후’ 스마트 인간-컴퓨터 상호 작용 체험’ 에 대한 사용자의 만족도를 더욱 높일 수 있기 때문이다. 생성식 AI 는 학습, 귀납적 창조, 추리를 더욱 강조하고, 생성식 AI 의 창작 능력은 콘텐츠 창작 위주로 인간의 의사결정을 보조하는 데 쓰인다. 사용자가’ 보조’ 에 대한 기준은 낮고, 관용도가 높고, 안전성과 정확성에 대한 기대치도 낮기 때문에 사람들의 관심과 기대를 불러일으키기 쉽다.
둘째, 생성식 AI 는’ 창작성’ 의 자연적 속성을 가지고 있다. 즉, 절대적인 옳고 그름의 구분이 없고, 심지어 어떤 인자들은 인자를 보고 지혜로운 사람은 지혜로움을 보는 의미도 있다. 의사 결정 AI 의 결과가 잘못되면 쉽게 비난받을 수 있습니다. 콘텐츠 창작의 다양성 결과는 흔쾌히 받아들여진다. 예를 들어, 현재 ChatGPT 는 일부 사실적 콘텐츠에 대한 결과는 그다지 정확하지 않지만, 대화가 원활하고 응답이 효과적이기 때문에 여전히 용인할 수 있다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 대화명언)
Q: 향후 생성 AI 기능이 향상됨에 따라 어떤 업종에서 빠르게 침투할 것으로 예상하십니까?
유카이: 단기적으로는 특정 배경 지식을 바탕으로 한 창작형 산업, 그리고 막 AIGC 가 필요한 모든 장면, SOP (표준 작업 절차) 를 중시하는 산업에 대해 빠른 돌파구를 마련할 수 있습니다. 스마트 쓰기, 문서 관리, 코드 생성, 프로세스 관리, 게임 NPC 등
장기적으로 검색 엔진과 검색 기반 관련 산업은 전복될 가능성이 있다.
Q: 최근 많은 중국 기업들이 관련 진전을 발표했습니다. 당신이 보기에 중국 과학기술회사와 해외 기업 간의 격차는 어떻습니까? 어떤 방면의 노력이 필요합니까?
유카이: 중미 격차는 사실 엔지니어링화 능력, 인프라 설정, 인적 경험 문제, 장기적 신념 결정 문제 등이 있습니다.
ChatGPT 의 핵심은 큰 모델 기술과 대화 지능 기술입니다. 큰 모델은 공통 기본 모델을 가리키며, 매개변수가 충분히 클 때 (예: 천억 레벨 이상의 큰 모델이 있을 경우) 더 이상 각 분야에 대한 추가 교육이 필요하지 않습니다. 큰 모델의 알고리즘은 일반적이며, 데이터의 양이 천억을 넘으면 대비가 더 이상 두드러지지 않습니다.
밑바닥의 기초 알고리즘은 공개적이고 국내외 일류 연구기관들은 모두 아주 좋은 연구 성과를 가지고 있어 알고리즘의 반복 혁신에 뚜렷한 차이가 없다. 데이터의 양이 충분할 때, 하찮은 데이터 격차의 영향도 그리 뚜렷하지 않다.
간단히 말해서, 기술적으로는 뚜렷한 차이가 없지만, 기술 실현의 시간차 문제가 있다.
Q: 중국이 언제 ChatGPT 를 표기할 수 있을 것으로 예상하십니까?
유카이: 몇 가지 객관적인 요인으로 인해 ChatGPT 는 국내에서 수토불복할 수도 있고, 단시간 테스트도 문제없을 수도 있지만, 장기적으로 안정적인 호출을 할 수는 없습니다. 나는 국내에 거물들이 관련 상품을 발표할 준비를 하고 있는 것을 보았다. 이것은 좋은 방향이다. GPT 와 같은 제품은 거대 기업의 투자와 결의에 의존해야 하지만, 더욱 기대되는 것은 중국 창업기업이 해당 방향에 기반한 응용급 혁신이다.
각 방면의 복합적인 요인으로 인해 R&D 환경에서 볼 때 외국은 0 에서 1 까지의 기초혁신에 더 많은 관심을 기울이고, 국내는 1 에서 N 까지의 응용급 혁신에 더 능하다.
신기술 출현의 본질은 기술 지표 수준에 머물지 않고 응용에 투입하기 위한 것이다. 저는 중국의 창업회사가 사용자 요구, 제품 상황, AI 보조, 스마트 오피스, 스마트 고객 서비스, 더 큰 수준의 산업 앱 등 더 많은 GPT 앱을 탐구할 수 있기를 기대합니다.
Q: 최근 ChatGPT 비용, 법률 및 윤리 문제를 둘러싼 많은 논의가 있습니다. 생성식 AI 가 직면한 주요 과제는 무엇이라고 생각하십니까?
유카이: 대형 모델 훈련은 확실히 비싸기 때문에 비용 측면에서는 거물만이 높은 투자를 감당할 수 있지만, 대규모로 적용하면 장기적으로 대형 모델 기술은 오히려 기계 학습 비용을 절감하고 응용 효율을 높일 수 있습니다.
인공지능 기술의 발전과 함께, 줄곧’ AI 가 하는 일, 하지 않는 일’ 에 대한 논의가 있었다. 기술 자체는 중립적이며, 관건은 기술을 운용하는 사람이 선을 행하고 악을 행하지 않는 것이다.
생성 AI 가 직면한 두 가지 주요 과제 중 하나는 데이터 소스 규정 준수, 데이터 처리 규정 준수, 데이터 생성 규정 준수를 포함한 데이터 규정 준수입니다. 두 번째는 인력 관리, 엔지니어링 구현, 장면 영역에서 적용 경계를 규범화해야 하는 것,’ 인간 대체’ 대신’ 인간 지원’ 을 더 잘 할 수 있는 방법, 심지어 deep fake 의 방범으로 전락할 수 있는 방법을 포함한다.
인공지능, 결국 인간의 지능이다. ChatGPT 는 문맥 이해를 바탕으로 대화 채팅에 따라 끊임없이 자기 학습과 진화를 보완할 수 있지만, 이런 진화 학습 메커니즘은 본질적으로 인간에 의해 설계된다. 물론, AI 의 좋은 순서 발전을 보장하기 위해서, 우리는 확실히 상응하는 제한 수단과 규칙 구속을 포함해야 한다.
Q: 최근 구글은 AI 기술이 급속도로 성장하고 대기업이 느리게 움직이는 이유를 지적했다. AI 를 기존 제품 및 서비스에 통합해야 하고, 회사의 비즈니스 전략에 맞게 전개할 수 있어야 하며, OpenAI 처럼 최고의 모델만 개발하면 되는 것은 아니다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 성공명언) 이것에 대해 어떻게 생각하십니까?
유카이: 기초 AI 기술 혁신은 결국 산업에 진출해야 장면 응용과 결합해야 가치가 있다.
새로운 인프라의 일환인 AI 기술은 기본적인 원시 혁신만으로는 발전을 추진할 수 없으며, 그 착지 앱은 업계 인식과 고객 수요 출력 무결성, 결과 지향적인 실용적인 솔루션을 결합해야 한다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 성공명언) 물론 OpenAI 와 같은 기본 모델 도구도 큰 가치를 가지고 있습니다. 기초연구와 응용연구 자체는 각기 다른 범주에 속하며, 상업회사는 더 많은 시장을 책임져야 하며, 생산비를 계산해야 하며, 응용형 연구에 투자하는 경향이 있다. 하지만 기초적인 연구는 더 낮은 수준의 알고리즘 도구와 더 앞날을 내다보는 기술의 미래를 더 순수하게 볼 수 있다. (윌리엄 셰익스피어, 윈스턴, 과학명언)
최근 몇 년 동안 산업도 산학연구 일체화 협력을 강화하고 있으며, 기술형 기업과 고교간 긴밀한 협력을 통해 기초연구와 응용연구의 융합을 추진하고 있다. 예를 들면, 비행과 중과대학, 사필치, 상교대다. 결국 인공지능의 발전은 장기주의다. 앞으로 더욱 안정적이고 강력한 돌파구를 위해 기초혁신과 원시혁신능력을 중시해야 한다. 단기간에 R&D 투자를 보면 높을 것이다. 하지만 장기적으로 비용을 절감하고 전반적인 효율을 높일 수 있다. 중국인의’ AI 광산’ 을 세우는 데도 도움이 되고, 전통 백업을 더 잘 할 수 있다.
(기자: 푸징; 편집: 조경천)
대화 1000 명의 업계 리더: 앤 인터뷰
보험 기관:
재료 금속:
애완동물 경제:
에너지 저장 장치:
미디어 혁신:
전자 상거래 플랫폼:
전원 배터리:
항구 부두:
하이엔드 장비:
공모 기금:
산업용 소프트웨어:
광전지 전자 장비:
국제 무역:
항공 우주:
집적 회로:
로봇:
가족 사무실:
조경 설계:
LED 전자 장치:
여행 교통:
농업 양식:
중개 기관:
평가 기관:
권위 있는 전문가, 연구원:
자동차 부품:
엔터프라이즈 서비스:
인공지능:
디지털 보안 및 테스트 측정:
디지털 경제:
탄소중립:
스포츠: telegram 의 다운로드 사이트는 어디에 있습니까?
투자 기관:
VR/AR/ 메타우주:
문화 관광:
새로운 에너지:
새 차:
신탁 기관:
신규 소비:
차세대 정보 기술:
의료:
은행 재테크:
영화 문화:
자동 조종 장치:
규제 기관:
정부 시스템: