Bài 2: AI tạo sinh làm việc như thế nào?
Khả năng tạo văn bản của các công cụ như ChatGPT và Bard dường như rất kỳ diệu. Chúng thực sự là một bước tiến lớn của công nghệ trí tuệ nhân tại AI. Nhưng việc tạo văn bản thực sự hoạt động như thế nào? Trong khoá học này, chúng ta sẽ tìm hiểu nền tảng cơ bản của AI tạo sinh. Bằng cách hiểu nền tảng cơ bản này, bạn hiểu khi nào thì nên áp dụng AI và khi nào thì không nên.
Vị trí của AI tạo sinh trong thế giới AI
Hiện nay có rất nhiều tin đồn, sự phấn khích và cường điệu về AI. Cách hữu ích nhất để nghĩ về AI là chúng ta sẽ xem AI như một tập hợp các công cụ. Một trong những phần quan trọng nhất của AI là học có giám sát. Công cụ này thực sự rất hiệu quả trong việc gắn nhãn cho mọi thứ. Nếu chưa biết thuật ngữ này nghĩa là gì thì cũng không sao, sang phần sau khoá học này chúng tôi sẽ giải thích cho bạn.
Công cụ thứ hai, chỉ mới bắt đầu hoạt động thực sự tốt gần đây là AI tạo sinh. Nếu bạn nghiên cứu về AI, bạn sẽ nhận ra rằng còn có những phần khác, chẳng hạn như những thứ gọi là học không giám sát và học tăng cường. Nhưng với mục đích tìm hiểu về AI tạo sinh, chúng ta sẽ đề cập ngắn gọn về học có giám sát là gì và sau đó dành phần lớn thời gian để nói về AI tạo sinh. Hai công cụ này, học có giám sát và AI tạo sinh, là hai phần quan trọng nhất trong AI hiện nay. Đối với việc sử dụng trong doanh nghiệp, bạn chỉ cần nắm vững hai công cụ này là đủ để nắm bắt các công cụ phổ biến hiện nay.
Trước khi mô tả cách hoạt động của AI tạo sinh, chúng ta hãy mô tả ngắn gọn thế nào là mô hình AI - học có giám sát vì AI tạo sinh được xây dựng bằng cách học có giám sát. Học có giám sát là công nghệ giúp máy tính hoạt động rất tốt khi được cung cấp đầu vào, gọi là A, để tạo ra đầu ra tương ứng, gọi là B.
Một vài ví dụ:
Vào những năm 2010-2020 là thập kỷ mà mô hình AI học có giám sát quy mô lớn và nó đã đặt nền móng cho AI tạo sinh hiện đại ngày nay. Vào khoảng năm 2010 có rất nhiều dữ liệu, nhưng khi cung cấp nhiều dữ liệu hơn, hiệu suất của nó cũng không tốt hơn nhiều nếu đào tạo với các mô hình AI nhỏ. Ví dụ, dù đổ thêm hàng trăm ngàn giờ ghi âm giọng nói thì hệ thống nhận diện giọng nói cũng không chính xác hơn.
Tuy nhiên, ngày càng nhiều nhà nghiên cứu bắt đầu nhận ra trong giai đoạn này là nếu bạn huấn luyện một mô hình AI rất lớn, nghĩa là một mô hình AI trên các máy tính rất nhanh, rất mạnh với nhiều bộ nhớ, thì hiệu suất của nó khi bạn đào tạo nó với nhiều dữ liệu hơn thì nó sẽ ngày càng tốt hơn. Chính vì lý do này mà đội ngũ Google Brain năm xưa hướng đến việc xây dựng các mô hình AI siêu lớn và cung cấp cho nó nguồn dữ liệu dồi dào. Cách làm này đã thúc đẩy tiến bộ AI rất hiệu quả.
Học có giám sát quy mô lớn ngày nay vẫn còn quan trọng, nhưng ý tưởng về các mô hình rất lớn để gắn nhãn cho mọi thứ chính là cách chúng ta có được AI tạo sinh ngày nay. Hãy xem cách AI tạo ra văn bản bằng cách sử dụng công nghệ được gọi là mô hình ngôn ngữ lớn. Đây là một cách mà các mô hình ngôn ngữ lớn, được viết tắt là LLM, có thể tạo ra văn bản. Một ví dụ: nếu bạn yêu cầu AI hoàn thành câu “Tôi thích ăn…” thì LLM có thể trả lời “…bánh mì vòng phô mai”, hoặc “…thịt nướng của mẹ tôi” ...
LLM được xây dựng bằng cách sử dụng phương pháp học có giám sát. Đó là công nghệ dựa vào dữ liệu nhập vào A và xuất nhãn B. Nó sử dụng phương pháp học có giám sát để liên tục dự đoán những từ tiếp theo. Ví dụ: nếu một hệ thống AI đọc được trên Internet một câu như: “Món ăn yêu thích của tôi là bánh mì tròn với phô mai kem”, thì câu này sẽ được chuyển thành rất nhiều điểm dữ liệu để AI cố gắng học cách dự đoán từ tiếp theo. Cụ thể, với câu này, bây giờ chúng ta có một điểm dữ liệu cho biết, với cụm từ, “món ăn yêu thích của tôi là…”, bạn nghĩ từ tiếp theo là gì? Trong trường hợp này, câu trả lời đúng là “bánh mì tròn”. Ngoài ra, “món ăn yêu thích của tôi là bánh mì tròn”, bạn nghĩ từ tiếp theo sẽ là gì? Nó sẽ phản hồi là “với”, v.v. Một câu này được chuyển thành nhiều đầu vào A và đầu ra B để nó cố gắng học và dự đoán từ tiếp theo tiếp theo là gì.
Khi bạn huấn luyện một hệ thống AI rất lớn trên nhiều dữ liệu, có nghĩa là hàng trăm tỷ từ hoặc trong một số trường hợp, hơn một nghìn tỷ từ, thì bạn sẽ có được một mô hình ngôn ngữ lớn như ChatGPT có thể đoán từ tiếp theo rất hiệu quả khi được gợi ý bằng vài từ đầu.
Hiện tại, bài học này đang bỏ qua một số chi tiết kỹ thuật vì chúng ta chưa cần biết đến trong giai đoạn ban đầu này. Vào chương tới, chúng ta sẽ nói về quy trình giúp LLM không chỉ dự đoán từ tiếp theo mà còn học cách làm theo hướng dẫn và những gì nó đưa ra chính xác hơn. Trọng tâm của LLM là công nghệ được học từ rất nhiều dữ liệu để dự đoán từ tiếp theo là gì. Đó là cách các mô hình ngôn ngữ lớn hoạt động, nó được đào tạo để liên tục dự đoán từ tiếp theo. Nhiều người dùng, có lẽ bao gồm cả bạn, đã nhận thấy những mô hình này hữu ích cho các hoạt động hàng ngày để hỗ trợ viết, tìm thông tin cơ bản hoặc trở thành đối tác tư tưởng để giúp suy nghĩ thấu đáo. Cùng xem một số ví dụ trong phần tiếp theo. Các bạn nhớ đón xem nhé.
Khả năng tạo văn bản của các công cụ như ChatGPT và Bard dường như rất kỳ diệu. Chúng thực sự là một bước tiến lớn của công nghệ trí tuệ nhân tại AI. Nhưng việc tạo văn bản thực sự hoạt động như thế nào? Trong khoá học này, chúng ta sẽ tìm hiểu nền tảng cơ bản của AI tạo sinh. Bằng cách hiểu nền tảng cơ bản này, bạn hiểu khi nào thì nên áp dụng AI và khi nào thì không nên.
Vị trí của AI tạo sinh trong thế giới AI
Hiện nay có rất nhiều tin đồn, sự phấn khích và cường điệu về AI. Cách hữu ích nhất để nghĩ về AI là chúng ta sẽ xem AI như một tập hợp các công cụ. Một trong những phần quan trọng nhất của AI là học có giám sát. Công cụ này thực sự rất hiệu quả trong việc gắn nhãn cho mọi thứ. Nếu chưa biết thuật ngữ này nghĩa là gì thì cũng không sao, sang phần sau khoá học này chúng tôi sẽ giải thích cho bạn.
Công cụ thứ hai, chỉ mới bắt đầu hoạt động thực sự tốt gần đây là AI tạo sinh. Nếu bạn nghiên cứu về AI, bạn sẽ nhận ra rằng còn có những phần khác, chẳng hạn như những thứ gọi là học không giám sát và học tăng cường. Nhưng với mục đích tìm hiểu về AI tạo sinh, chúng ta sẽ đề cập ngắn gọn về học có giám sát là gì và sau đó dành phần lớn thời gian để nói về AI tạo sinh. Hai công cụ này, học có giám sát và AI tạo sinh, là hai phần quan trọng nhất trong AI hiện nay. Đối với việc sử dụng trong doanh nghiệp, bạn chỉ cần nắm vững hai công cụ này là đủ để nắm bắt các công cụ phổ biến hiện nay.
Trước khi mô tả cách hoạt động của AI tạo sinh, chúng ta hãy mô tả ngắn gọn thế nào là mô hình AI - học có giám sát vì AI tạo sinh được xây dựng bằng cách học có giám sát. Học có giám sát là công nghệ giúp máy tính hoạt động rất tốt khi được cung cấp đầu vào, gọi là A, để tạo ra đầu ra tương ứng, gọi là B.
Một vài ví dụ:
- [*=1]Nhận email (A), xác định có phải spam hay không (B). Các bộ lọc spam hiện đại đều dùng công nghệ này. [*=1]Nhận quảng cáo và thông tin người dùng (A), dự đoán người đó có nhấp vào quảng cáo không (B). Ứng dụng này mang lại doanh thu khổng lồ cho các nền tảng quảng cáo trực tuyến. [*=1]Trong xe tự lái, từ ảnh chụp phía trước xe (A), hệ thống AI xác định vị trí những chiếc xe khác (B). [*=1]Và vô số các ứng dụng khác, từ chẩn đoán hình ảnh y khoa đến phát hiện lỗi sản phẩm trên dây chuyền lắp ráp, hay phiên dịch giọng nói thành chữ viết...
Vào những năm 2010-2020 là thập kỷ mà mô hình AI học có giám sát quy mô lớn và nó đã đặt nền móng cho AI tạo sinh hiện đại ngày nay. Vào khoảng năm 2010 có rất nhiều dữ liệu, nhưng khi cung cấp nhiều dữ liệu hơn, hiệu suất của nó cũng không tốt hơn nhiều nếu đào tạo với các mô hình AI nhỏ. Ví dụ, dù đổ thêm hàng trăm ngàn giờ ghi âm giọng nói thì hệ thống nhận diện giọng nói cũng không chính xác hơn.
Tuy nhiên, ngày càng nhiều nhà nghiên cứu bắt đầu nhận ra trong giai đoạn này là nếu bạn huấn luyện một mô hình AI rất lớn, nghĩa là một mô hình AI trên các máy tính rất nhanh, rất mạnh với nhiều bộ nhớ, thì hiệu suất của nó khi bạn đào tạo nó với nhiều dữ liệu hơn thì nó sẽ ngày càng tốt hơn. Chính vì lý do này mà đội ngũ Google Brain năm xưa hướng đến việc xây dựng các mô hình AI siêu lớn và cung cấp cho nó nguồn dữ liệu dồi dào. Cách làm này đã thúc đẩy tiến bộ AI rất hiệu quả.
Học có giám sát quy mô lớn ngày nay vẫn còn quan trọng, nhưng ý tưởng về các mô hình rất lớn để gắn nhãn cho mọi thứ chính là cách chúng ta có được AI tạo sinh ngày nay. Hãy xem cách AI tạo ra văn bản bằng cách sử dụng công nghệ được gọi là mô hình ngôn ngữ lớn. Đây là một cách mà các mô hình ngôn ngữ lớn, được viết tắt là LLM, có thể tạo ra văn bản. Một ví dụ: nếu bạn yêu cầu AI hoàn thành câu “Tôi thích ăn…” thì LLM có thể trả lời “…bánh mì vòng phô mai”, hoặc “…thịt nướng của mẹ tôi” ...
LLM được xây dựng bằng cách sử dụng phương pháp học có giám sát. Đó là công nghệ dựa vào dữ liệu nhập vào A và xuất nhãn B. Nó sử dụng phương pháp học có giám sát để liên tục dự đoán những từ tiếp theo. Ví dụ: nếu một hệ thống AI đọc được trên Internet một câu như: “Món ăn yêu thích của tôi là bánh mì tròn với phô mai kem”, thì câu này sẽ được chuyển thành rất nhiều điểm dữ liệu để AI cố gắng học cách dự đoán từ tiếp theo. Cụ thể, với câu này, bây giờ chúng ta có một điểm dữ liệu cho biết, với cụm từ, “món ăn yêu thích của tôi là…”, bạn nghĩ từ tiếp theo là gì? Trong trường hợp này, câu trả lời đúng là “bánh mì tròn”. Ngoài ra, “món ăn yêu thích của tôi là bánh mì tròn”, bạn nghĩ từ tiếp theo sẽ là gì? Nó sẽ phản hồi là “với”, v.v. Một câu này được chuyển thành nhiều đầu vào A và đầu ra B để nó cố gắng học và dự đoán từ tiếp theo tiếp theo là gì.
Khi bạn huấn luyện một hệ thống AI rất lớn trên nhiều dữ liệu, có nghĩa là hàng trăm tỷ từ hoặc trong một số trường hợp, hơn một nghìn tỷ từ, thì bạn sẽ có được một mô hình ngôn ngữ lớn như ChatGPT có thể đoán từ tiếp theo rất hiệu quả khi được gợi ý bằng vài từ đầu.
Hiện tại, bài học này đang bỏ qua một số chi tiết kỹ thuật vì chúng ta chưa cần biết đến trong giai đoạn ban đầu này. Vào chương tới, chúng ta sẽ nói về quy trình giúp LLM không chỉ dự đoán từ tiếp theo mà còn học cách làm theo hướng dẫn và những gì nó đưa ra chính xác hơn. Trọng tâm của LLM là công nghệ được học từ rất nhiều dữ liệu để dự đoán từ tiếp theo là gì. Đó là cách các mô hình ngôn ngữ lớn hoạt động, nó được đào tạo để liên tục dự đoán từ tiếp theo. Nhiều người dùng, có lẽ bao gồm cả bạn, đã nhận thấy những mô hình này hữu ích cho các hoạt động hàng ngày để hỗ trợ viết, tìm thông tin cơ bản hoặc trở thành đối tác tư tưởng để giúp suy nghĩ thấu đáo. Cùng xem một số ví dụ trong phần tiếp theo. Các bạn nhớ đón xem nhé.