CLB PMTDNM Việt Nam (VFOSSA)Website chính thức của Câu lạc bộ Phần mềm Tự do Nguồn mở Việt Nam (VFOSSA) - Chi hội của Hội Tin học Việt Nam (VAIP)
VNese Laws AI System - Tận dụng sức mạnh của các mô hình ngôn ngữ lớn để tạo ra các tính năng tiện ích thông minh cho người dùng trong sản phẩm phần mềm nguồn mở
Thứ năm - 21/12/2023 03:26
Sản phẩm do team VKU.NewEnergy phát triển đã có cách tiếp cận khác là khai thác tối đa sức mạnh của các dịch vụ mô hình ngôn ngữ lớn do OpenAI cung cấp để huấn luyện, tạo nguồn dữ liệu riêng về tri thức pháp luật phục vụ cho quá trình hỏi đáp của người dùng với chatbot. Đây là một trong hai đội xuất sắc giành giải Nhì hạng mục Phần mềm nguồn mở - Olympic Tin học sinh viên 2023.
VNese Laws AI System được xây dựng theo mô hình kiến trúc microservices với nhiều modules chức năng được phát triển độc lập, có thể mở rộng một cách dễ dàng. Phần mềm tận dụng sức mạnh của các mô hình ngôn ngữ lớn như BERT và GPT để tạo ra các tính năng tiện ích thông minh cho người dùng để khai thác tri thức pháp luật một cách thuận tiện từ Bộ Pháp điển và CSDL văn bản QPPL Việt Nam.
Mục tiêu:
Xây dựng một hệ thống truy xuất thông tin và tra cứu đầy đủ về pháp luật Việt Nam, bao gồm dữ liệu từ: Bộ Pháp Điển Việt Nam và CSDL các văn bản quy phạm pháp luật hiện hành.
Xây dựng trợ lý ảo AI có khả năng tư vấn, giải đáp các thắc mắc của người dùng về pháp luật Việt Nam.
Các chức năng chính:
Tra cứu nội dung liên quan từ pháp điển và các văn bản quy phạm pháp luật hiện hành thông qua ngữ nghĩa và từ khóa từ người dùng
AI Chatbot có thể trả lời câu hỏi người dùng về vấn đề pháp luật
Tổng quan công nghệ:
Hệ thống triển khai theo mô hình microservices
Cài đặt kĩ thuật RAG để truy xuất tri thức pháp luật, kết hợp mô hình ngôn ngữ lớn GPT-3.5-turbo để sinh câu trả lời
Định hướng phát triển:
Cập nhật dữ liệu định kỳ, tự động: các văn bản quy phạm pháp luật mới trên csdl được thêm mới rất thường xuyên, hệ thống cần tự động cập nhật dữ liệu định kỳ một cách tự động.
Nghiên cứu các kĩ thuật RAG nâng cao nhằm cải thiện độ chính xác cho hệ thống tìm kiếm
Nghiên cứu và cài đặt các kĩ thuật bảo mật cho mô hình ngôn ngữ lớn.