Bởi Eduardo Baptista
BẮC KINH (Reuters) – Quỹ đầu tư định lượng, High-Flyer, đã xây dựng một danh mục trị giá 100 tỷ nhân dân tệ (13,79 tỷ USD) sử dụng các mô hình trí tuệ nhân tạo để đưa ra quyết định đầu tư, nhưng vào năm 2023 quyết định đổi hướng để tập trung vào việc phát triển trí tuệ nhân tạo tiên tiến nhất.
Trong một bài đăng trên tài khoản WeChat chính thức của mình, Hangzhou Huanfang Technology Ltd Co., như tên công ty chính thức gọi, cho biết họ sẽ tập trung theo đuổi trí tuệ nhân tạo tổng quát (AGI).
“High-Flyer sẽ tập trung tài nguyên và sức mạnh của mình, hoàn toàn cống hiến để phục vụ công nghệ AI mang lại lợi ích cho toàn nhân loại, tạo ra một nhóm nghiên cứu độc lập mới và khám phá bản chất của AGI,” công ty cho biết.
OpenAI, do Microsoft hỗ trợ, đã phát triển ChatGPT, định nghĩa AGI là các hệ thống tự động vượt trội hơn con người trong hầu hết các nhiệm vụ có giá trị kinh tế.
Đây là thế hệ mô hình AI tiếp theo và trong một bài đăng trên X tuần trước, Giám đốc điều hành OpenAI, Sam Altman, cho biết công ty của ông vẫn chưa đạt được cột mốc đó.
Các r
Nhóm nghiên cứu do High-Flyer dự kiến là DeepSeek, với những mô hình đã làm rung chuyển ngành công nghệ toàn cầu trong những tuần gần đây. Nhà sáng lập và cổ đông kiểm soát của High-Flyer, Lương Văn Phong, cũng là người lãnh đạo kín đáo của DeepSeek.
Sự tinh vi của các mô hình DeepSeek đã nhận được nhiều lời khen ngợi từ các đối thủ ở Silicon Valley, điều này là một lần đầu tiên cho một mô hình AI của Trung Quốc, nhưng những tuyên bố của công ty khởi nghiệp rằng họ chỉ sử dụng một phần nhỏ sức mạnh tính toán mà các công ty hàng đầu của Hoa Kỳ triển khai cho các mô hình của chính họ đã kích hoạt một đợt bán tháo cổ phiếu công nghệ trên toàn cầu.
Chưa rõ DeepSeek đang tiến gần đến việc phát triển một mô hình AGI đến mức nào.
Mặc dù thành công của DeepSeek dường như xảy ra gần như qua đêm, High-Flyer cho thấy cách mà sự bùng nổ này đã được chuẩn bị trong hơn một thập kỷ.
Dưới sự lãnh đạo của Lương, quỹ đã dành nhiều năm nghiên cứu và thử nghiệm với các mô hình AI nước ngoài, áp dụng công nghệ này vào doanh nghiệp của họ, và đầu tư hàng chục triệu đô la vào các chip Nvidia (NASDAQ:NVDA) cao cấp để cung cấp sức mạnh tính toán.
cần thiết để hỗ trợ chiến lược tập trung vào AI này, theo một cuộc đánh giá của Reuters về trang web của High-Flyer và các tài khoản WeChat chính thức.
CÁC CỤM SIÊU MÁY TÍNH
Điều này bao gồm việc xây dựng hai cụm siêu máy tính AI, hoàn toàn được cấu thành từ các chip A100 mạnh mẽ của Nvidia, mà Washington đã cấm xuất khẩu sang Trung Quốc vào tháng 9 năm 2022.
Các cụm A100 của High-Flyer được xây dựng và đưa vào hoạt động từ lâu trước khi các kiểm soát xuất khẩu được công bố. Cụm đầu tiên của nó, được tạo thành từ 1.100 chip A100, có chi phí 200 triệu nhân dân tệ và đã được đưa vào hoạt động vào năm 2020, trong khi cụm thứ hai, được tạo thành từ khoảng 10.000 chip A100, hoàn thành một năm sau đó với chi phí 1 tỷ nhân dân tệ, theo trang web của công ty và một số bài đăng trên WeChat.
Vào năm 2022, các nhà nghiên cứu AI của High-Flyer đã trình bày một chiến lược tại một hội nghị của Nvidia mà công ty đã phát triển để tối đa hóa hiệu quả của cụm thứ hai khi đào tạo các mô hình AI.
Chưa rõ High-Flyer đã đầu tư bao nhiêu vào DeepSeek. High-Flyer có một văn phòng tọa lạc tại
cùng tòa nhà với DeepSeek, và nó cũng sở hữu các bằng sáng chế liên quan đến cụm chip được sử dụng để đào tạo các mô hình AI.
Liang sở hữu 55% cổ phần trong High-Flyer, một công ty tư nhân và nắm giữ 99% quyền biểu quyết, theo các hồ sơ doanh nghiệp của Trung Quốc. Các cổ phần còn lại thuộc về các giám đốc điều hành khác trong quỹ.
Cho đến nay, DeepSeek chỉ tuyên bố sử dụng các chip H800 và H20 kém mạnh mẽ hơn nhiều của Nvidia để đào tạo mô hình DeepSeek-V3 của mình và phiên bản kế nhiệm DeepSeek-V2, điều này đã gây ra một cuộc chiến giá mô hình AI ở Trung Quốc khi được phát hành vào tháng Năm năm ngoái.
Tuy nhiên, một số giám đốc công nghệ đã công khai tuyên bố rằng DeepSeek có nhiều sức mạnh tính toán hơn rất nhiều.
Giám đốc điều hành Scale AI, Alexandr Wang, đã nói trong một cuộc phỏng vấn với CNBC vào thứ Năm, mà không có bằng chứng, rằng DeepSeek có 50.000 chip Nvidia H100, mà ông tuyên bố không được tiết lộ vì điều đó sẽ vi phạm các quy định xuất khẩu của Washington, cấm xuất khẩu chip H100 sang Trung Quốc cùng lúc với chip A100 kém mạnh mẽ hơn.
DeepSeek đã không phản hồi yêu cầu
để bình luận về cáo buộc. Nvidia cũng không ngay lập tức phản hồi một email yêu cầu bình luận.
Nhưng mối quan tâm của Liang về sức mạnh tính toán khi thảo luận về tương lai của DeepSeek phản ánh khoản đầu tư khổng lồ của quỹ định lượng của ông vào các cụm AI. Khi được hỏi trong một cuộc phỏng vấn với phương tiện truyền thông Trung Quốc Waves vào tháng Bảy năm ngoái liệu High-Flyer có kế hoạch tách DeepSeek ra khỏi công ty và đưa nó ra công chúng hay không, Liang đã trả lời:
“Chúng tôi không có kế hoạch huy động tiền trong ngắn hạn, vấn đề mà chúng tôi đối mặt chưa bao giờ là tiền, mà là lệnh cấm đối với các chip cao cấp.”
($1 = 7.2507 nhân dân tệ Trung Quốc)
Bình luận (0)