링크세상 링크모음
링크세상 링크모음 링크 애니 웹툰 링크 드라마 영화 링크 세상의모든링크

ChatGPT는 곧 보고, 말하고, 들을 수 있게 됩니다

ChatGPT가 창의적인 작업의 환경을 계속해서 변화시키고 있기 때문에 좋든 나쁘든 기술에 대한 새로운 업데이트로 인해 봇은 단순히 단어를 작성하는 것보다 훨씬 더 많은 일을 할 수 있습니다.

ChatGPT를 소유하고 운영하는 회사인 Open AI는 자사의 봇이 곧 사진을 분석하고 오디오 대화를 할 수 있게 될 것이라고 월요일 발표했습니다.

사용자는 장면이나 물체의 사진을 업로드한 다음 ChatGPT에 보이는 내용에 대해 이야기하고 이미지 인식을 통해 사진에 수반되는 내용에 대해 질문할 수 있습니다.

관련 항목: ChatGPT: 정의 및 작동 방식

음성 기능을 통해 ChatGPT는 누군가가 말하는 “단 몇 초”만 듣고 음성을 모방하고 음성을 생성합니다.

물론 Open AI는 이로 인해 “악의적인 행위자가 공인을 사칭하거나 사기를 저지를 가능성”이 발생할 수 있다고 경고했습니다. 그러나 회사에서는 ChatGPT가 이전에 회사에서 승인한 시스템에 있는 음성으로만 말할 것이라고 말합니다.

Open AI는 릴리스에서 “우리는 ChatGPT에서 새로운 음성 및 이미지 기능을 출시하기 시작했습니다. 이는 음성 대화를 하거나 ChatGPT에 말하는 내용을 보여줄 수 있도록 하여 새롭고 보다 직관적인 유형의 인터페이스를 제공합니다.”라고 밝혔습니다. .

관련 항목: ChatGPT의 실제 위협은 도구 자체가 아닙니다

Spotify는 팟캐스트 번역에 AI를 사용하고 있습니다

Spotify는 이번 주에 음성 번역 기능에 이미 새로운 기술을 사용하고 있다고 밝혔습니다. 이 기능을 사용하면 원래 팟캐스터의 음성 및 보컬 억양을 계속 사용하면서 장문의 팟캐스트를 다른 언어로 번역할 수 있습니다.

“Spotify에서 개발한 이 도구는 최신 혁신 기술(OpenAI가 새로 출시한 음성 생성 기술 중 하나)을 활용하여 원래 화자의 스타일에 맞춰 기존 더빙보다 더 개인적이고 자연스럽게 들리는 보다 실제적인 청취 경험을 제공합니다.”라고 회사는 설명했습니다. 릴리스에서.

Open AI는 음성 및 이미지 기능이 앞으로 2주 안에 ChatGPT Plus 및 Enterprise 사용자에게 출시될 것이라고 밝혔습니다.