아크로팬

산업 경제 테크 게임
사회 생활 자동차 미디어

Cambridge Quantum, 세계 최초의 QNLP 툴킷 및 라이브러리 출시

  • 2021-10-14 08:26
  • ACROFAN=PRNewswire
  • mediainquiries@prnewswire.com


-- 문장을 양자 회로로 전환하는 'lambeq', 실용적인 QNLP 용도를 양자 컴퓨팅 시스템 규모로의 개발 속도 높여




케임브리지, 잉글랜드, 2021년 10월 13일 /PRNewswire/ -- Cambridge Quantum[https://cambridgequantum.com/  ]("CQ")이 양자 자연어 처리(Quantum Natural Language Processing, QNLP)를 위한 세계 최초의 툴킷과 라이브러리를 출시한다고 오늘 발표했다. 이 툴킷은 작고한 수학자이자 언어학자인 Joachim Lambek의 이름을 본떠서 'lambeq'라고 명명했다.




lambeq는 문장을 양자 회로로 변환할 수 있는 세계 최초의 QNLP 소프트웨어 툴킷이다. 이 툴킷은 자동 대화, 텍스트 마이닝, 언어 번역, 텍스트에서 발화로 전환, 언어 생성, 생물정보학 같은 실용적인 실세계 QNLP 애플리케이션 개발을 가속할 수 있도록 설계됐다.




lambeq는 세계 양자 컴퓨팅 커뮤니티와 빠르게 성장 중인 양자 컴퓨팅 연구원, 개발자 및 사용자 에코시스템을 위해 완전한 개방 소스 기반으로 출시됐다. lambeq는 CQ의 TKET[https://cambridgequantum.com/cambridge-quantums-tket-is-now-open-sourced/ ]과도 원활하게 작동한다. TKET은 세계에서 가장 빠르게 성장 중인 완전한 개방 소스의 주요 양자 소프트웨어 개발 플랫폼이다. 덕분에 QNLP 개발자들은 가장 광범위한 양자 컴퓨터 라인에 대한 접근성을 얻게 됐다.




수석 과학자 Bob Coecke가 이끌고, 선임 과학자 Dimitrios Kartsaklis, Ph.D.가 최고 플랫폼 설계가로 활약하는 QC의 옥스퍼드 양자 컴퓨팅 연구팀이 lambeq를 구상, 설계 및 제작했다. lambeq, 그리고 더욱 광범위하게는 QNLP는 10년 전에 시작된 한 연구 프로젝트의 결실이다.




Coecke는 "우리 팀은 세계에서 가장 다루기 힘든 인공 지능 문제를 해결하는 데 양자 컴퓨터를 사용하는 방법을 모색하는 기초 작업에 참여해왔다"라며 "이 작업은 본래 본인과 현 CQ AI 책임자인 Steve Clark, 그리고 기타 연구원들이 개척한 발전을 기반으로 한 것"이라고 말했다. 이어 그는 "이 연구의 핵심은 NLP"라면서 "수개월 전, 자사는 실제 양자 컴퓨터에서 세계 최초로 QNLP를 시행한 자세한 결과를 발표했고, 2019년 12월에는 자사의 기초 원칙을 최초로 공개한 바 있다. 따라서 이번 lambeq 출시는 그 이후의 자연스러운 단계"라고 설명했다.




또한, Coecke는 "작년에 발표한 다양한 연구 논문에서 자사는 양자 컴퓨터가 NLP를 향상시킬 수 있는 방식에 관한 자세한 정보를 제공했을 뿐만 아니라, QNLP가 '양자 네이티브(quantum native)'라는 것도 입증했다"라며, "이는 언어를 지배하는 구성 구조가 양자 시스템을 지배하는 구조와 수학적으로 동일하다는 의미다. 또한, 이는 불투명한 근사치인 억지 기법에 의존하는 현 AI 패러다임으로부터 궁극적으로 세계를 떼어놓을 것"이라고 덧붙였다.




lambeq는 CQ 과학자들이 설명한 구성-분산(compositional-distributional, DisCo) 유형의 NLP 실험 설계와 배치를 지원 및 자동화한다. 그에 따라, 텍스트 구조를 부호화하는 구문/문법 도식으로부터 멀어지고, TKET으로 시행되는 (고전적) 텐서 네트워크(tensor network)나 양자 회로로 이동하며, 문서 분류 같은 머신 러닝 과제에 최적화된다. lambeq는 사용자가 모델 안팎으로 구성요소를 바꾸고, 구조 설계에서 유연성을 발휘할 수 있도록 모듈성으로 설계됐다.




lambeq는 양자 기술의 가장 중요한 용도 중 하나인 AI와 인간-기계 상호작용에 집중하는 종사자와 연구원을 위해 진입 장벽을 없앴다. TKET는 수십만 명에 달하는 국제적인 사용자 기반을 확보했다. lambeq는 AI를 위한 가장 중요한 시장 중 하나인 QNLP 애플리케이션과의 관계를 끊임없이 모색하는 가장 중요한 양자 컴퓨팅 툴킷이 될 잠재력이 있다. 최근 확실해진 핵심 포인트 중 하나는 QNLP가 단백질 유전 정보학뿐만 아니라 유전체학에서도 부상하는 기호 시퀀스 분석에도 적용할 수 있다는 것이다.




lambeq 출시 파트너이자 얼리 어답터인 Merck Group이 뮌헨 공과대학의 혁신 프로그램 Quantum Entrepreneurship Laboratory와 진행하는 프로젝트의 일환으로 최근 QNLP에 관한 연구 보고서를 발표했다.




Merck의 IT Healthcare Innovation Incubator이자 Quantum Computing Interest Group의 공동설립자인 Thomas Ehmer는 "기초적인 혁신을 위해 양자 컴퓨팅의 독특한 특징을 이용하는 것은 Merck 연구에서 중요한 부분"이라며 "최근 뮌헨 공과대학 연구원들과 발표한 QNLP 프로젝트에서는 QNLP 기법을 사용하는 문장 이항 분류 과제가 이 단계에서도 기존의 고전적인 방법에 필적하는 결과를 낼 수 있음을 입증했다"라고 밝혔다. 이어 그는 "이 기법이 상업적으로 채택되기 전에 양자 컴퓨팅을 둘러싼 기반시설이 확실히 발전할 전망"이라면서 "QNLP에서 채택한 접근법이 설명 가능한 AI, 그리고 그에 따라 책임질 수 있는 더욱 정확한 정보로 향하는 길을 나아가는 방식을 비평적으로 확인할 수 있을 것이다. 이는 의료계에서 매우 중요한 부분"이라고 설명했다.




Kartsaklis는 "QNLP에 관한 흥미로운 이론 작업이 많지만, 보통 이론은 실행과 거리가 있다"라며 "lambeq는 현재로서는 완전히 탐색하지 못한 영역인 QNLP의 실험적 측면에 관한 사항을 직접 체험할 기회를 제공한다. 이는 양자 하드웨어에서 실용적인 실세계 NLP 적용이 현실이 되는 지점으로 향하는 중요한 단계"라고 강조했다.




lambeq는 GitHub에서 전통적인 파이선(Python) 저장소로 출시됐으며, 웹사이트 https://github.com/CQCL/lambeq에서 다운로드받을 수 있다. lambeq로 생성한 양자 회로는 지금까지 IBM 양자 컴퓨터와 Honeywell Quantum Solutions의 H 시리즈 장치에서 실행 및 시행됐다.




이 툴킷은 웹사이트 https://arxiv.org/abs/2110.04236에서 볼 수 있는 arxiv 업로드 전문 보고서에서 소개됐다. 일반적으로 접근성이 더 좋은 블로그 포스팅은 https://medium.com/cambridge-quantum-computing/quantum-natural-language-processing-ii-6b6a44b319b2에서 확인할 수 있다. 기술적인 부분은 이메일 lambeq-support@cambridgequantum.com으로 문의할 수 있다.




최근 수 년간 NLP 기반 애플리케이션이 고객 서비스와 소비자 기술부터 건강관리와 광고에 이르기까지, 전 세계 여러 부문에서 매우 흔하게 등장하기 시작했다. 업계 분석에 따르면, 세계 NLP 시장의 연평균 성장률(CAGR)은 30%에 달하며, 2028년에는 1천272억6천만 달러 규모가 될 전망이라고 한다[1].




Cambridge Quantum 소개



2014년에 설립된 CQ는 양자 소프트웨어 및 양자 알고리듬 분야의 글로벌 선도기업이다. 회사는 세계 유수의 양자 컴퓨팅 기업의 지원을 받으며, 빠르게 진화하는 양자 컴퓨팅 하드웨어를 최대한 활용할 수 있도록 고객을 지원한다. CQ는 유럽, 미국, 일본에 사무실을 두고 있으며, 지난 6월 8일에는 올 4분기에 마무리될 것으로 예상되는 Honeywell Quantum Solutions와의 합병을 발표했다.




추가 정보는 CQ 웹사이트 https://www.cambridgequantum.com을 방문하거나 링크트인[https://www.linkedin.com/company/21661539/ ]을 참조한다. GitHub[https://github.com/CQCL ]에서 lambeq TKET의 소스 코드, 파이선 바인딩 및 유틸리티에 접속할 수 있다.




[1] https://www.fortunebusinessinsights.com/industry-reports/natural-language-processing-nlp-market-101933