Tổng quan GOAT.AI - Task to AI Agents
Điều phối các Nhiệm vụ của Đại lý theo định hướng mục tiêu. Về cơ bản, các Tác nhân AI sẽ liên lạc với nhau để thực hiện nhiệm vụ của bạn.
Ví dụ: "chọn ngày tốt nhất vào tháng tới để tham gia cuộc thi bán marathon 20 km". AI sẽ bắt đầu cộng tác: tác nhân Thời tiết truy xuất dự báo, tác nhân tìm kiếm Web xác định các điều kiện hoạt động tối ưu và tác nhân Wolfram tính toán "ngày tốt nhất". Đó là nghệ thuật kết nối AI, đơn giản hóa các nhiệm vụ phức tạp một cách tinh tế.
LLM làm máy tính lớn trung tâm cho các tác nhân tự trị là một khái niệm hấp dẫn. Các cuộc trình diễn như AutoGPT, GPT-Engineer và BabyAGI đóng vai trò là những minh họa đơn giản cho ý tưởng này. Tiềm năng của LLM còn mở rộng ra ngoài việc tạo ra hoặc hoàn thành các bản sao, câu chuyện, bài tiểu luận và chương trình được viết tốt; họ có thể được coi là Người giải quyết nhiệm vụ chung mạnh mẽ và đó là điều chúng tôi mong muốn đạt được khi xây dựng Cơ cấu điều phối theo định hướng mục tiêu của Lực lượng đặc nhiệm (GOAT.AI)
Để sự điều phối theo định hướng mục tiêu của hệ thống lực lượng đặc nhiệm LLM tồn tại và hoạt động bình thường, ba thành phần cốt lõi chính của hệ thống phải hoạt động bình thường
- Tổng quan
1) Lập kế hoạch
- Mục tiêu phụ và phân rã: Tác nhân chia nhỏ các nhiệm vụ lớn thành các mục tiêu phụ nhỏ hơn, có thể quản lý được, giúp xử lý các nhiệm vụ phức tạp một cách hiệu quả dễ dàng hơn.
- Suy ngẫm và sàng lọc: Người đại diện tham gia vào việc tự phê bình và tự suy ngẫm về các hành động trong quá khứ, học hỏi từ những sai lầm và cải thiện cách tiếp cận cho các bước trong tương lai, từ đó nâng cao chất lượng tổng thể của kết quả.
2) Trí nhớ
- Bộ nhớ ngắn hạn: Nó đề cập đến lượng văn bản mà mô hình có thể xử lý trước khi trả lời mà không bị suy giảm chất lượng. Ở trạng thái hiện tại, LLM có thể cung cấp câu trả lời mà không làm giảm chất lượng cho khoảng 128 nghìn mã thông báo.
- Bộ nhớ dài hạn: Điều này cho phép tác nhân lưu trữ và gọi lại lượng thông tin không giới hạn cho ngữ cảnh trong thời gian dài. Nó thường đạt được bằng cách sử dụng kho lưu trữ vectơ bên ngoài cho các hệ thống RAG hiệu quả.
3) Không gian hành động
- Tác nhân có được khả năng gọi các API bên ngoài để lấy thông tin bổ sung không có trong trọng số mô hình (thường khó sửa đổi sau khi đào tạo trước). Điều này bao gồm truy cập thông tin hiện tại, thực thi mã, truy cập các nguồn thông tin độc quyền và quan trọng nhất: yêu cầu các tác nhân khác để truy xuất thông tin.
- Không gian hành động cũng bao gồm các hành động không nhằm mục đích lấy lại thứ gì đó mà liên quan đến việc thực hiện các hành động cụ thể và đạt được kết quả cuối cùng. Ví dụ về các hành động như vậy bao gồm gửi email, khởi chạy ứng dụng, mở cửa trước, v.v. Những hành động này thường được thực hiện thông qua nhiều API khác nhau. Ngoài ra, điều quan trọng cần lưu ý là các tác nhân cũng có thể gọi các tác nhân khác cho các sự kiện có thể hành động mà họ có quyền truy cập.
Ví dụ: "chọn ngày tốt nhất vào tháng tới để tham gia cuộc thi bán marathon 20 km". AI sẽ bắt đầu cộng tác: tác nhân Thời tiết truy xuất dự báo, tác nhân tìm kiếm Web xác định các điều kiện hoạt động tối ưu và tác nhân Wolfram tính toán "ngày tốt nhất". Đó là nghệ thuật kết nối AI, đơn giản hóa các nhiệm vụ phức tạp một cách tinh tế.
LLM làm máy tính lớn trung tâm cho các tác nhân tự trị là một khái niệm hấp dẫn. Các cuộc trình diễn như AutoGPT, GPT-Engineer và BabyAGI đóng vai trò là những minh họa đơn giản cho ý tưởng này. Tiềm năng của LLM còn mở rộng ra ngoài việc tạo ra hoặc hoàn thành các bản sao, câu chuyện, bài tiểu luận và chương trình được viết tốt; họ có thể được coi là Người giải quyết nhiệm vụ chung mạnh mẽ và đó là điều chúng tôi mong muốn đạt được khi xây dựng Cơ cấu điều phối theo định hướng mục tiêu của Lực lượng đặc nhiệm (GOAT.AI)
Để sự điều phối theo định hướng mục tiêu của hệ thống lực lượng đặc nhiệm LLM tồn tại và hoạt động bình thường, ba thành phần cốt lõi chính của hệ thống phải hoạt động bình thường
- Tổng quan
1) Lập kế hoạch
- Mục tiêu phụ và phân rã: Tác nhân chia nhỏ các nhiệm vụ lớn thành các mục tiêu phụ nhỏ hơn, có thể quản lý được, giúp xử lý các nhiệm vụ phức tạp một cách hiệu quả dễ dàng hơn.
- Suy ngẫm và sàng lọc: Người đại diện tham gia vào việc tự phê bình và tự suy ngẫm về các hành động trong quá khứ, học hỏi từ những sai lầm và cải thiện cách tiếp cận cho các bước trong tương lai, từ đó nâng cao chất lượng tổng thể của kết quả.
2) Trí nhớ
- Bộ nhớ ngắn hạn: Nó đề cập đến lượng văn bản mà mô hình có thể xử lý trước khi trả lời mà không bị suy giảm chất lượng. Ở trạng thái hiện tại, LLM có thể cung cấp câu trả lời mà không làm giảm chất lượng cho khoảng 128 nghìn mã thông báo.
- Bộ nhớ dài hạn: Điều này cho phép tác nhân lưu trữ và gọi lại lượng thông tin không giới hạn cho ngữ cảnh trong thời gian dài. Nó thường đạt được bằng cách sử dụng kho lưu trữ vectơ bên ngoài cho các hệ thống RAG hiệu quả.
3) Không gian hành động
- Tác nhân có được khả năng gọi các API bên ngoài để lấy thông tin bổ sung không có trong trọng số mô hình (thường khó sửa đổi sau khi đào tạo trước). Điều này bao gồm truy cập thông tin hiện tại, thực thi mã, truy cập các nguồn thông tin độc quyền và quan trọng nhất: yêu cầu các tác nhân khác để truy xuất thông tin.
- Không gian hành động cũng bao gồm các hành động không nhằm mục đích lấy lại thứ gì đó mà liên quan đến việc thực hiện các hành động cụ thể và đạt được kết quả cuối cùng. Ví dụ về các hành động như vậy bao gồm gửi email, khởi chạy ứng dụng, mở cửa trước, v.v. Những hành động này thường được thực hiện thông qua nhiều API khác nhau. Ngoài ra, điều quan trọng cần lưu ý là các tác nhân cũng có thể gọi các tác nhân khác cho các sự kiện có thể hành động mà họ có quyền truy cập.
Xem thêm