Artificial Analysis: Mô hình R1-0528 giúp DeepSeek vượt Meta, xAI và Anthropic, chỉ kém OpenAI

Kết quả đánh giá hiệu năng do DeepSeek trích dẫn cho thấy mô hình trí tuệ nhân tạo (AI) suy luận R1-0528 đã vượt Qwen3 của Alibaba và ngang ngửa sản phẩm từ OpenAI, Google.

Bản nâng cấp DeepSeek-R1 vượt Qwen3 và Claude 3.7 về lập trình, chỉ thua o3 và o4-mini của OpenAI

DeepSeek đã đưa phiên bản R1-0528 lên nền tảng Hugging Face mà không có bất kỳ tài liệu hay thông báo chính thức nào, song hiệu suất của mô hình trí tuệ nhân tạo (AI) suy luận này đã được cải thiện, theo các bài đánh giá chuẩn.

Mô hình AI y tế của Alibaba đạt chuẩn phó trưởng khoa trong kỳ thi, vượt DeepSeek-R1 và GPT-4o

Dữ liệu chuẩn do Quark cung cấp cho thấy mô hình trí tuệ nhân tạo (AI) chăm sóc sức khỏe của Alibaba có độ chính xác vượt trội so với DeepSeek-R1 và V3, cũng như GPT-4o của OpenAI.