링크세상 링크모음
링크세상 링크모음 링크 애니 웹툰 링크 드라마 영화 링크 세상의모든링크

OpenAI, ChatGPT의 음성, 이미지 기능 발표

OpenAI는 ChatGPT에 음성 및 이미지 기능을 도입하여 사용자가 AI 시스템과 상호 작용할 수 있는 범위를 확장한다고 발표했습니다. 이러한 기능을 통해 사용자는 ChatGPT와 음성 대화에 참여하고 이미지를 공유할 수 있어 인터페이스를 더욱 직관적으로 만드는 것을 목표로 합니다.

음성 상호 작용을 통해 사용자는 대화 방식으로 ChatGPT와 통신할 수 있습니다. 이 기능은 텍스트 음성 변환 모델과 오픈 소스 음성 인식 시스템인 Whisper를 활용하여 대화를 촉진합니다. 이 기능은 iOS 및 Android 플랫폼에서 사용할 수 있습니다.

이미지 인식 기능을 통해 사용자는 문제 해결, 식사 계획, 업무 관련 데이터 분석 등 다양한 목적으로 ChatGPT와 이미지를 공유할 수 있습니다. 사용자는 모바일 앱의 그리기 도구를 활용하여 이미지의 특정 부분에 초점을 맞출 수 있습니다. 이미지 이해 기능은 다중 모드 GPT-3.5 및 GPT-4 모델을 통해 제공됩니다.

OpenAI는 이러한 기능에 대한 단계적 출시 전략을 결정하여 처음에는 Plus 및 Enterprise 사용자가 사용할 수 있도록 했습니다. 음성 및 이미지 기능은 앞으로 2주 동안 이러한 사용자 그룹에 액세스할 수 있을 것으로 예상됩니다.

이번 출시는 새로운 기능을 점진적으로 배포하여 AGI(인공 일반 지능)의 안전과 유익한 사용을 보장하려는 OpenAI의 접근 방식과 일치합니다. 또한 실제 사용 및 피드백을 기반으로 잠재적인 개선과 개선을 위한 길을 열어줍니다.

현실적인 합성 음성 및 비전 기반 모델의 의미에 대한 우려가 인정되었습니다. 음성 기술은 창의적이고 접근성 중심의 애플리케이션을 제공하는 동시에 명의 도용이나 사기와 같은 위험도 제시합니다. 반면, 비전 기반 모델은 환각부터 고위험 영역의 이미지 해석에 대한 의존도까지 다양한 문제를 야기합니다.

OpenAI는 또한 ChatGPT의 특정 제한 사항을 인정하여 특히 전문 지식이 필요한 분야에서 적절한 검증 없이 전문적인 주제에 의존하지 말라고 사용자에게 조언했습니다.

이번 발표는 사용자가 ChatGPT와 가질 수 있는 상호 작용 범위를 확장하기 위한 단계를 나타내며, AI 시스템의 기능을 개선하고 강화하려는 OpenAI의 지속적인 노력을 반영합니다.

더 많은 중소기업 뉴스를 보려면 팔로우하세요:

중소기업 동향 뉴스



더 보기: ChatGPT