새로운 임베딩 모델과 API 업데이트

새로운 세대의 임베딩 모델, 새로운 GPT-4 터보 및 모더레이션 모델, 새로운 API 사용 관리 도구를 출시하고 있으며, 곧 GPT-3.5 터보의 가격을 인하할 예정입니다.

빠른 링크

문서 읽기

New Embeddings Models And API Updates

새로운 모델을 출시하고, GPT-3.5 Turbo의 가격을 인하하며, 개발자들이 API 키를 관리하고 API 사용 현황을 이해할 수 있는 새로운 방법을 소개합니다. 새로운 모델은 다음과 같습니다:

두 가지 새로운 임베딩 모델
업데이트된 GPT-4 Turbo 미리보기 모델
업데이트된 GPT-3.5 Turbo 모델
업데이트된 텍스트 모더레이션 모델

기본적으로 OpenAI API로 전송된 데이터는 OpenAI 모델을 훈련하거나 개선하는 데 사용되지 않습니다.

새로운 임베딩 모델과 더 낮은 가격

우리는 두 가지 새로운 임베딩 모델을 소개합니다: 더 작고 효율적인 text-embedding-3-small 모델과 더 크고 강력한 text-embedding-3-large 모델.

임베딩은 자연어나 코드와 같은 콘텐츠 내의 개념을 나타내는 일련의 숫자입니다. 임베딩은 기계 학습 모델과 다른 알고리즘이 콘텐츠 간의 관계를 이해하고 클러스터링이나 검색과 같은 작업을 수행하기 쉽게 만듭니다. 이러한 임베딩은 ChatGPT와 Assistants API에서 지식 검색과 같은 응용 프로그램을 구동하며, 많은 검색 증강 생성(RAG) 개발 도구에도 활용됩니다.

새로운 소형 텍스트 임베딩 모델

text-embedding-3-small은 우리의 새롭고 효율적인 임베딩 모델로, 그 이전 모델인 text-embedding-ada-002 모델보다 크게 향상되었습니다. 이전 모델은 2022년 12월에 출시되었습니다.

더 강력한 성능. text-embedding-ada-002와 text-embedding-3-small을 비교할 때, 다국어 검색을 위한 일반적으로 사용되는 벤치마크(MIRACL)에서의 평균 점수가 31.4%에서 44.0%로 증가했으며, 영어 작업을 위한 일반적으로 사용되는 벤치마크(MTEB)에서의 평균 점수가 61.0%에서 62.3%로 증가했습니다.

할인된 가격. text-embedding-3-small은 이전 세대 모델인 text-embedding-ada-002보다 훨씬 더 효율적입니다. 따라서 text-embedding-3-small의 가격은 text-embedding-ada-002에 비해 5배 낮춰졌으며, 1k 토큰당 가격이 $0.0001에서 $0.00002로 조정되었습니다.

text-embedding-ada-002를 폐기하는 것이 아니므로, 우리는 새로운 모델을 추천하지만 고객들이 이전 세대 모델을 계속 사용하는 것을 환영합니다.

새로운 대형 텍스트 임베딩 모델: text-embedding-3-large

text-embedding-3-large는 우리의 새로운 차세대 대형 임베딩 모델로, 최대 3072 차원의 임베딩을 생성합니다.

더 강력한 성능. text-embedding-3-large는 우리의 새로운 최고 성능 모델입니다. text-embedding-ada-002와 text-embedding-3-large를 비교할 때: MIRACL에서 평균 점수는 31.4%에서 54.9%로 증가했으며, MTEB에서는 평균 점수가 61.0%에서 64.6%로 증가했습니다.

text-embedding-3-large는 1k 토큰당 $0.00013의 가격으로 책정될 것입니다.

새로운 임베딩 모델 사용에 대해 더 알아보려면 임베딩 가이드를 참조하세요.

임베딩을 축소하기 위한 네이티브 지원

예를 들어, 벡터 저장소에 저장하여 검색하는 것과 같이 더 큰 임베딩을 사용하는 것은 일반적으로 더 작은 임베딩을 사용하는 것보다 더 많은 비용이 들고, 더 많은 계산, 메모리 및 저장 공간을 소비합니다.

우리의 새로운 임베딩 모델 두 개는 개발자들이 임베딩 사용의 성능과 비용 사이의 균형을 맞출 수 있도록 하는 기술로 훈련되었습니다. 구체적으로, 개발자들은 dimensions API 파라미터를 전달함으로써 임베딩이 그 개념을 나타내는 속성을 잃지 않고 임베딩을 단축시킬 수 있습니다(예를 들어, 시퀀스 끝에서 일부 숫자를 제거). 예를 들어, MTEB 벤치마크에서 text-embedding-3-large 임베딩은 256 크기로 단축될 수 있으면서도 크기가 1536인 단축되지 않은 text-embedding-ada-002 임베딩보다 더 우수한 성능을 보입니다.

| ada v2 | 텍스트 임베딩-3-소형 | 텍스트 임베딩-3-대형 | | | | | | ------------------ | ---------------------- | ---------------------- | ---- | ---- | ---- | ---- | | 임베딩 크기 | 1536 | 512 | 1536 | 256 | 1024 | 3072 | | 평균 MTEB 점수 | 61.0 | 61.6 | 62.3 | 62.0 | 64.1 | 64.6 |

이를 통해 매우 유연한 사용이 가능합니다. 예를 들어, 최대 1024 차원의 임베딩만 지원하는 벡터 데이터 저장소를 사용할 때 개발자는 이제 저희 최고의 임베딩 모델 text-embedding-3-large를 사용하고 dimensions API 파라미터에 1024 값을 지정하여 3072 차원의 임베딩을 줄일 수 있으며, 이는 더 작은 벡터 크기를 위해 일부 정확도를 희생하는 것을 의미합니다.

다른 새로운 모델과 낮아진 가격

업데이트된 GPT-3.5 터보 모델 및 낮아진 가격

다음 주에는 새로운 GPT-3.5 Turbo 모델, gpt-3.5-turbo-0125를 소개하고, 지난 1년 동안 세 번째로 GPT-3.5 Turbo의 가격을 인하하여 고객들이 확장할 수 있도록 도와드릴 예정입니다. 새 모델의 입력 가격은 50% 감소한 $0.0005 /1K 토큰으로, 출력 가격은 25% 감소한 $0.0015 /1K 토큰으로 조정됩니다. 이 모델은 요청된 형식으로 응답하는 정확도가 더 높아지는 등 다양한 개선 사항을 포함하며, 영어가 아닌 언어 함수 호출에 대한 텍스트 인코딩 문제를 일으킨 버그에 대한 수정도 포함되어 있습니다.

고정된 gpt-3.5-turbo 모델 별칭을 사용하는 고객은 이 모델이 출시된 후 2주가 지나면 자동으로 gpt-3.5-turbo-0613에서 gpt-3.5-turbo-0125로 업그레이드됩니다.

업데이트된 GPT-4 터보 미리보기

GPT-4 API 고객의 요청 중 70% 이상이 업데이트된 지식 컷오프, 더 큰 128k 컨텍스트 윈도우, 그리고 더 낮은 가격의 이점을 활용하면서 출시 이후 GPT-4 Turbo로 전환되었습니다.

오늘, 우리는 업데이트된 GPT-4 Turbo 미리보기 모델인 gpt-4-0125-preview를 출시합니다. 이 모델은 이전 미리보기 모델보다 코드 생성과 같은 작업을 더 철저하게 수행하며, 모델이 작업을 완료하지 않는 '게으름' 사례를 줄이기 위해 고안되었습니다. 새 모델에는 비영어 UTF-8 생성에 영향을 미치는 버그 수정도 포함되어 있습니다.

새로운 GPT-4 Turbo 프리뷰 버전으로 자동 업그레이드를 원하는 분들을 위해, 우리는 항상 최신 GPT-4 Turbo 프리뷰 모델을 가리키는 새로운 gpt-4-turbo-preview 모델 이름 별칭을 소개하고 있습니다.

우리는 몇 달 안에 일반 사용자를 위해 시각 기능을 탑재한 GPT-4 터보를 출시할 계획입니다.

업데이트된 모더레이션 모델

무료 Moderation API는 개발자들이 잠재적으로 해로운 텍스트를 식별할 수 있게 해줍니다. 지속적인 안전 작업의 일환으로, 우리는 지금까지 가장 강력한 모더레이션 모델인 text-moderation-007을 출시하였습니다. text-moderation-latest와 text-moderation-stable 별칭이 이를 가리키도록 업데이트되었습니다. 안전한 AI 시스템 구축에 대해 더 알아보려면 우리의 안전 최우선 가이드를 참조하세요.

API 사용 방식 이해 및 API 키 관리를 위한 새로운 방법

개발자가 사용 현황을 더 잘 파악하고 API 키를 더 잘 관리할 수 있도록 두 가지 플랫폼 개선 사항을 출시합니다.

먼저, 개발자들은 이제 API 키 페이지에서 API 키에 권한을 할당할 수 있습니다. 예를 들어, 키에 읽기 전용 접근 권한을 할당하여 내부 추적 대시보드를 운영하거나, 특정 엔드포인트에만 접근하도록 제한할 수 있습니다.

둘째, 추적을 시작한 후 사용 대시보드와 사용량 내보내기 기능이 이제 API 키 수준에서 메트릭을 공개합니다. 이를 통해 각 기능, 팀, 제품 또는 프로젝트별로 별도의 API 키를 사용함으로써 사용량을 간단히 확인할 수 있습니다.

향후 몇 달 안에, 특히 대규모 조직에서 개발자들이 API 사용 현황을 보고 API 키를 관리할 수 있는 능력을 더욱 향상시킬 계획입니다.

OpenAI의 API에 대한 최신 업데이트는 X에서 @OpenAIDevs를 팔로우하세요.

저자들

감사의 글

준탕 주앙, 폴 발테스쿠, 조이 지아오, 아빈드 닐라칸탄, 앤드류 브라운스타인, 제프 해리스, 로건 킬패트릭, 레허 파타크, 이녹 청, 테드 샌더스, 유탄 리우, 아누쉬리 아그라왈, 앤드류 펭, 이안 키블리칸, 메흐멧 야트바즈, 마들레인 보이드, 안나-루이사 브랙맨, 플로렌시아 레오니 알레만, 헨리 헤드, 몰리 린, 메건 샤, 첼시 칼슨, 샘 토이저, 라이언 그린, 앨리슨 하몬, 데니 진, 카롤리스 코사스, 마리 이누즈카, 피터 박쿰, 바렛 조프, 루크 메츠, 지아이 웽, 랜달 린, 야쉬 파틸, 미안나 첸, 앤드류 콘드리치, 브라이든 이스트먼, 리암 페더스, 존 슐먼, 블라드 포멘코, 안드레이 카르파티, 에이든 클라크, 오웬 캠벨-무어