
Microsoft vào thứ Tư đã giới thiệu Deepseek R1 về danh mục mô hình rộng lớn của mình trên Azure AI Foundry và GitHub, thêm vào bộ sưu tập bây giờ vượt quá 1.800 mô hình. Các mô hình này trải dài từ các giải pháp AI dựa trên Frontier và Mở đến các giải pháp AI dành riêng cho ngành và dựa trên công nghiệp.
DeepSeek R1 Access và tính năng
Deepseek R1 hiện có thể truy cập thông qua Azure AI Foundry, cung cấp một nền tảng đáng tin cậy, có thể mở rộng và sẵn sàng cho doanh nghiệp. Thiết lập này cho phép các doanh nghiệp tích hợp các giải pháp AI nâng cao một cách liền mạch trong khi tuân thủ các thỏa thuận cấp độ dịch vụ (SLA), các tiêu chuẩn bảo mật và thực tiễn AI có trách nhiệm, tất cả được hỗ trợ bởi cam kết của Microsoft về độ tin cậy và đổi mới.
AI lý luận tăng tốc
Asha Sharma, phó chủ tịch công ty của AI Platform tại Microsoft, nhấn mạnh sự gia tăng nhanh chóng trong khả năng tiếp cận của AI Lý luận, điều này đang thay đổi cách các nhà phát triển và doanh nghiệp sử dụng AI tiên tiến.
Bà nhấn mạnh rằng Deepseek R1 cung cấp một mô hình hiệu quả chi phí cho người dùng để tận dụng các khả năng AI hiện đại với đầu tư cơ sở hạ tầng tối thiểu.
Công cụ phát triển và tốc độ
Việc tích hợp Deepseek R1 trên Azure AI Foundry tăng tốc quá trình thử nghiệm, lặp lại và tích hợp cho các nhà phát triển. Với các công cụ để đánh giá mô hình, các nhà phát triển có thể so sánh đầu ra, hiệu suất điểm chuẩn và quy mô các ứng dụng AI một cách nhanh chóng.
Cam kết phát triển AI đáng tin cậy
Sharma nhấn mạnh sự cống hiến của Microsoft cho sự an toàn và an ninh, lưu ý rằng Deepseek R1 đã trải qua kiểm tra an toàn và hợp tác màu đỏ nghiêm ngặt. Azure AI An toàn nội dung cung cấp lọc nội dung mặc định với các tùy chọn từ chối và hệ thống đánh giá an toàn hỗ trợ các ứng dụng thử nghiệm trước khi chúng đi vào hoạt động, đảm bảo môi trường triển khai an toàn.
Truy cập DeepSeek R1
Để sử dụng DeepSeek R1:
- Đăng ký tài khoản Azure nếu bạn không có.
- Tìm kiếm Deepseek R1 trong danh mục mô hình Foundry Azure AI.
- Mở thẻ mô hình và nhấp vào triển khai trên mạng để có được API và khóa suy luận và truy cập vào sân chơi.
- Sử dụng API và khóa với các máy khách khác nhau để tích hợp ứng dụng.
Triển khai cục bộ trên Copilot+ PCS
Microsoft cũng đang đưa các phiên bản được tối ưu hóa NPU của DeepSeek R1 đến Copilot+ PC, bắt đầu với Qualcomm Snapdragon X, tiếp theo là Intel Core Ultra 200V.
Bản phát hành ban đầu, Deepseek-R1-Distill-Qwen-1.5b, sẽ có sẵn trong bộ công cụ AI, với các biến thể 7b và 14b để theo dõi. Các mô hình này cho phép các nhà phát triển tạo và triển khai các ứng dụng chạy bằng AI chạy hiệu quả trên thiết bị, sử dụng các đơn vị xử lý thần kinh mạnh mẽ (NPU).
NPU trên Copilot+ PCS hỗ trợ suy luận mô hình hiệu quả, cho phép thực hiện bán liên tục AI. Những nỗ lực của Microsoft với Phi Silica đã dẫn đến tỷ lệ thông lượng và thời gian cạnh tranh đến đầu tiên trong khi giảm thiểu tác động đến thời lượng pin và tài nguyên PC.
Các mô hình DeepSeek được tối ưu hóa cho NPU sử dụng các kỹ thuật như lượng tử hóa bit và ánh xạ máy biến áp thấp đến NPU, đảm bảo khả năng tương thích trên hệ sinh thái Windows thông qua định dạng ONNX QDQ.
Tối ưu hóa silicon
Mô hình QWEN 1.5B chưng cất bao gồm các thành phần như tokenizer, lớp nhúng, mô hình xử lý ngữ cảnh, mô hình lặp mã thông báo, đầu mô hình ngôn ngữ và Detokenizer.
Microsoft sử dụng lượng tử hóa khối 4 bit cho đầu nhúng và mô hình ngôn ngữ, với các hoạt động này chạy trên CPU. Tối ưu hóa NPU tập trung vào các khối máy biến áp chuyên sâu tính toán, sử dụng lượng tử hóa Per4 per Int4 và độ chính xác hỗn hợp chọn lọc cho các trọng số với kích hoạt INT16.
Microsoft tận dụng một thiết kế cửa sổ trượt để hỗ trợ nhanh chóng đến trước hết và dài. Sơ đồ lượng tử hóa 4 bit giúp tăng cường độ chính xác bằng cách loại bỏ các ngoại lệ trong trọng số và kích hoạt. Các tối ưu hóa này đạt được thời gian từ đầu đến trước là 130 ms và tốc độ thông lượng là 16 token/s cho các lời nhắc ngắn (
Có sẵn
DeepSeek R1 bây giờ là có sẵn thông qua một điểm cuối không có máy chủ trong danh mục mô hình Foundry Azure AI. Nhiều tài nguyên và hướng dẫn từng bước có sẵn trên GitHub. Các phiên bản chưng cất của DeepSeek R1 để triển khai cục bộ trên Copilot+ PC sẽ sớm được truy cập.
Khám phá thêm từ Global Resources
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.