Meta đang đưa ra câu trả lời miễn phí cho GPT-4 của OpenAI. Động thái này có thể tăng cường cho cuộc bùng nổ AI tạo sinh bằng cách giúp các doanh nhân xây dựng các hệ thống AI mới mạnh mẽ dễ dàng hơn.
VÀO THÁNG 5, một bản ghi chép ẩn danh, dường như do một nhà nghiên cứu của Google viết ra, cho thấy lo ngại về tương lai của công ty này đã bị rò rỉ lên mạng. Nó lập luận rằng, trong khi các giám đốc điều hành tranh cãi về sự cạnh tranh trong ngành công nghệ tạo văn bản với OpenAI, thì phần mềm nguồn mở đang “âm thầm ăn chặn chúng tôi”.
Để chứng minh, bản ghi chép này đã trích dẫn về Llama, một mô hình ngôn ngữ lớn do Meta tạo ra, ban đầu chỉ dành cho các nhà nghiên cứu được mời sử dụng nhưng chỉ trong vài ngày đã bị rò rỉ trên 4Chan* và nhanh chóng trở nên hấp dẫn với các lập trình viên đã sửa đổi và xây dựng dựa theo nó. Trong vòng vài tuần sau khi phát hành, các biến thể có tên Alpaca và Vicuna** hoạt động tốt gần bằng ChatGPT nhưng vẫn đủ linh hoạt để có thể tùy chỉnh bằng máy tính xách tay. Bản ghi bị rò rỉ của Google cho biết: “Không thể không phóng đại tác động đối với cộng đồng. Đột nhiên bất cứ ai cũng có thể thử nghiệm.”
Tuần trước, Meta đã phát hành Llama 2, phiên bản thứ hai của mô hình bất ngờ nổi tiếng này. Lần này, nó là mã nguồn mở và miễn phí cho mục đích thương mại ngay từ đầu. Phiên bản mới được tạo bằng cách sử dụng nhiều dữ liệu hơn 40% so với phiên bản gốc và một chatbot được xây dựng bằng mô hình này có thể tạo ra kết quả ngang bằng với ChatGPT của OpenAI, theo Meta tuyên bố.
Cũng giống như ChatGPT, Google Bard và các mô hình AI tạo sinh khác được phát hành gần đây, để tạo ra được Llama 2 cần tiêu tốn hàng triệu USD. Nhưng chỉ có hệ thống của Meta là miễn phí cho các nhà phát triển, công ty khởi nghiệp và những người khác quan tâm đến việc tạo các biến thể tùy chỉnh của mô hình này. Bằng cách đưa ra một lựa chọn rẻ hơn, Llama 2 của Meta giúp các công ty nhỏ hoặc lập trình viên đơn lẻ dễ dàng tạo ra các sản phẩm và dịch vụ mới, có khả năng thúc đẩy sự bùng nổ AI hiện tại.
Meta không chỉ cung cấp một sản phẩm Llama 2. Nó có được sự hỗ trợ, với một số đối tác lớn đã và đang cung cấp mô hình này cho khách hàng của họ, bao gồm các công ty khởi nghiệp về AI HuggingFace, Databricks và OctoML.
Microsoft, công ty đã đầu tư 10 tỷ USD vào OpenAI, cũng sẽ cung cấp các bản Llama 2 có thể tải xuống cho các nhà phát triển để sử dụng trên Cloud hoặc Windows. Tại một hội nghị dành cho khách hàng của Microsoft vào tuần trước, Giám đốc điều hành Satya Nadella đã hào hứng phát biểu về việc các nhà phát triển có thể sử dụng AI nguồn mở của Meta đồng thời với các dịch vụ độc quyền của OpenAI. Bộ phận cloud của Amazon, AWS, cũng cung cấp quyền truy cập vào Llama 2.
Ahmad Al-Dahle, phó chủ tịch phụ trách AI tạo sinh của Meta, từ chối cho biết vai trò của việc rò rỉ mô hình Llama đầu tiên trong chiến lược mới của công ty đối với Llama 2.
“Nếu bạn nhìn lại lịch sử của Meta, chúng tôi đã từng là người ủng hộ mạnh mẽ của mã nguồn mở,” ông cho biết, đồng thời chỉ ra ví dụ về PyTorch, một công cụ phổ biến dành cho các nhà phát triển chương trình học máy. “Một trong những động lực chính để xây dựng một cộng đồng xung quanh vấn đề này là chúng tôi nhận thấy có những người có nhu cầu làm việc trên các mô hình này và cải thiện chúng, ngoài các nhà nghiên cứu ra.” Al-Dahle cho biết công việc phát triển Llama 3 đang được tiến hành, nhưng ông không nói rõ nó sẽ khác như thế nào.
Mặc dù Llama 2 mang lại uy tín cho Meta với tư cách là công ty hàng đầu về AI nguồn mở, không phải tất cả các khía cạnh của bản phát hành này đều có thể được mô tả là mở. Dữ liệu đào tạo được sử dụng để tạo ra mô hình này chỉ được mô tả trong các tài liệu phát hành là “các nguồn trực tuyến có sẵn và công khai”, và công ty sẽ không cung cấp thêm thông tin chi tiết về những gì đã tạo ra mô hình này.
Giấy phép của Meta cho Llama 2 cũng yêu cầu các công ty có hơn 700 triệu người dùng hoạt động hàng tháng phải thiết lập một thỏa thuận cấp phép riêng với Meta. Không rõ tại sao, nhưng điều khoản này tạo ra rào cản đối với những công ty công nghệ khổng lồ khác cũng đang xây dựng trên hệ thống này. Mô hình này cũng đi kèm với chính sách sử dụng được chấp nhận, cấm tạo mã độc hại, khuyến khích bạo lực hoặc tạo điều kiện cho hoạt động tội phạm, lạm dụng hoặc quấy rối. Meta đã không trả lời câu hỏi về những hành động mà họ có thể thực hiện nếu việc sử dụng Llama vi phạm những chính sách đó.
Jon Turow, một nhà đầu tư tại Madrona Ventures ở Seattle, cho biết sự thay đổi của Meta từ việc cố gắng hạn chế phân phối mô hình Llama đầu tiên sang cung cấp nguồn mở cho mô hình thứ hai có thể tạo ra một làn sóng sáng tạo mới bằng cách sử dụng các mô hình ngôn ngữ lớn. Ông nói: “Các nhà phát triển và doanh nhân rất tháo vát, và họ sẽ tìm ra những gì họ có thể tận dụng được từ Llama 2.”
Turow so sánh lựa chọn phát hành Llama 2 trong tháng này của Meta với việc Google giới thiệu hệ điều hành di động Android vào năm 2007 để cạnh tranh với iOS của Apple. Bằng cách đưa ra một giải pháp thay thế rẻ nhưng mạnh mẽ, Meta có thể trở thành đối trọng với các hệ thống độc quyền như hệ thống do OpenAI phát triển, tạo ra sự đổi mới có thể đem lại các ý tưởng giúp cải thiện các sản phẩm và dịch vụ của Meta.
Nathan Lambert, nhà nghiên cứu AI của Hugging Face, một công ty khởi nghiệp phát hành phần mềm học máy nguồn mở, bao gồm cả các mô hình tạo sinh, cho biết Llama 2 là mô hình được phát hành công khai đầu tiên có khả năng ngang bằng với ChatGPT. Ông không coi dự án này thực sự là nguồn mở vì những tiết lộ hạn chế của Meta về sự phát triển của nó, nhưng vẫn phải ngạc nhiên trước số lượng các biến thể của Llama 2 mà ông đã thấy trong nguồn cấp dữ liệu mạng xã hội của mình. Một ví dụ là phiên bản mới nhất của WizardLM, một hệ thống AI tương tự như ChatGPT, được thiết kế để tuân theo các hướng dẫn phức tạp. Tám trong số 10 mô hình đang thịnh hành trên Hugging Face, một vài trong số đó là phần mềm tạo hội thoại, là các biến thể của Llama 2.
Lambert nói: “Tôi nghĩ có khả năng Llama 2 là sự kiện AI lớn nhất trong năm. Ông nói rằng các mô hình độc quyền hiện tại đang có lợi thế, nhưng ông tin rằng các phiên bản Llama sau này sẽ bắt kịp và, chẳng bao lâu nữa, sẽ có thể thực hiện hầu hết các tác vụ mà hiện tại mọi người đều đang dùng ChatGPT để thực hiện.
Lambert cũng cho biết bản phát hành Llama 2 để lại một số câu hỏi chưa được giải đáp, một phần là do thiếu tài liệu về dữ liệu đào tạo. Và hiện trạng chỉ những người chơi lớn như Meta, Google, Microsoft và OpenAI mới có tài nguyên máy tính và nhân viên cần thiết để tạo ra các mô hình ngôn ngữ lớn hàng đầu sẽ vẫn tiếp diễn.
Tuy nhiên, ông vẫn hy vọng rằng, bất chấp sự thành công của phương pháp độc quyền của OpenAI, các mô hình ngôn ngữ đang chuyển sang kỷ nguyên minh bạch mới. Một thỏa thuận tự nguyện giữa Nhà Trắng và 7 công ty AI lớn đang kêu gọi kiểm tra khả năng phân biệt đối xử, tác động đến xã hội hoặc an ninh quốc gia trước khi triển khai.
Xu hướng đó có thể bị thách thức bởi những câu hỏi ngày càng tăng về trách nhiệm pháp lý đối với các hệ thống AI và áp lực pháp lý ngày càng tăng từ các chính trị gia, những người lo sợ rằng các mô hình mã nguồn mở sẽ bị kẻ xấu lợi dụng.
Giống như Demis Hassabis, nhà nghiên cứu hiện đang dẫn đầu quá trình phát triển AI của Google, Turow không đồng ý với khẳng định được đưa ra trong bản ghi bị rò rỉ của Google, rằng họ và các công ty AI lớn khác đang bị đe dọa bởi AI nguồn mở. Ông cho rằng dữ liệu, tài năng và khả năng tiếp cận máy tính mạnh hơn sẽ tiếp tục bảo vệ các công ty công nghệ lớn nhất—nhưng không biến chúng thành bất khả chiến bại.
Hiện ông đang theo dõi xem các công ty khởi nghiệp và nhà nghiên cứu làm gì với Llama 2, hy vọng sẽ thấy họ nhanh chóng cải thiện nó, như điều đã xảy ra với phiên bản đầu tiên của mô hình Meta. Ông cho rằng điều đó sẽ tạo ra những khả năng mới cho cả các công ty khởi nghiệp lẫn lĩnh vực AI rộng lớn hơn. Turow nói: “Chúng ta đang chứng kiến mã nguồn mở liên tục trở nên tốt hơn, từ đó tạo ra những bất ngờ làm những người lãnh đạo tiên phong đau đầu. Tôi không thể ngờ được chuyện gì sẽ xảy ra.”
Dịch giả: Vũ Ngọc Bảo
Link bài gốc: https://www.wired.com/story/metas-open-source-llama-upsets-the-ai-horse-race/