Mã ổn định 3B: Lập trình trên ranh giới — Stabiliti AI

nội dung

Hôm nay, chúng tôi công bố phiên bản Mô hình Ngôn ngữ Lớn đầu tiên của chúng tôi trong năm 2024: Stable Code 3B. Mô hình LLM mới này là một bản cập nhật của phiên bản trước đó Stable Code Alpha 3B và là phiên bản chính đầu tiên của Stable Code, cung cấp một mô hình mới tiên tiến được thiết kế cho việc hoàn thành mã với nhiều khả năng bổ sung.

So với CodeLLaMA 7b, Stable Code 3B nhỏ gọn hơn 60% trong khi vẫn đạt hiệu suất cấp cao tương tự trên các ngôn ngữ lập trình. Dựa trên mô hình cơ bản Stable LM 3B đã được huấn luyện trên 4 nghìn tỷ token dữ liệu ngôn ngữ tự nhiên, Stable Code tiếp tục được huấn luyện trên dữ liệu cụ thể về kỹ thuật phần mềm, bao gồm mã nguồn. Kích thước nhỏ gọn của mô hình cho phép chạy nó một cách riêng tư trên các thiết bị cạnh tranh trong thời gian thực trên các laptop hiện đại, thậm chí là những laptop không có GPU riêng.

Tóm tắt
Hôm nay, chúng tôi công bố việc phát hành mô hình ngôn ngữ lớn đầu tiên của năm 2024: Stable Code 3B. Mô hình mới này được thiết kế để hoàn thành mã nguồn với nhiều tính năng bổ sung và hiệu suất cao. Stable Code 3B có kích thước nhỏ hơn 60% so với CodeLLaMA 7b nhưng vẫn đạt hiệu suất tương tự. Mô hình này được huấn luyện trên 18 ngôn ngữ lập trình và cho hiệu suất tốt trên nhiều ngôn ngữ lập trình. Ngoài ra, mô hình còn hỗ trợ Fill in the Middle capabilities (FIM) và kích thước ngữ cảnh mở rộng. Stable Code 3B cũng được huấn luyện trên dữ liệu kỹ thuật phần mềm và mã nguồn. Mô hình này cũng hỗ trợ Flash Attention 2. Chi tiết về dữ liệu và mô hình có thể được tìm thấy trong model card. Công ty cũng sẽ phát hành một báo cáo kỹ thuật đầy đủ với các chi tiết và phân tích thêm.