Mô hình AI mã nguồn mở mới từ Trung Quốc - Hunyuan hé lộ đá Deepseek, Qwen và ChatGPT ra "chuồng gà"

vnrcraw4
Chi Le
Phản hồi: 0

Chi Le

Thành viên nổi tiếng
Tencent đã phát hành Hunyuan-A13B, một mô hình ngôn ngữ lớn mã nguồn mở được thiết kế để mang lại hiệu suất mạnh mẽ ngay cả trong môi trường có nguồn lực hạn chế. Mô hình AI mã nguồn mở Hunyuan-A13B Mô hình kết hợp kiến trúc Mixture-of-Experts (MoE) chi tiết, có 13 tỷ tham số hoạt động trong tổng số 80 tỷ. Kiến trúc MoE cho phép mô hình chỉ kích hoạt một tập hợp con các tham số của nó cho một tác vụ nhất định, cải thiện hiệu quả và khả năng mở rộng so với các mô hình...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top