Gặp gỡ sinh viên Nguyễn Tấn Minh – giải nhất sinh viên NCKH cấp Trường với đề tài hấp dẫn: Sử dụng công nghệ AI hỗ trợ xử lý văn bản pháp luật
Nguyễn Tấn Minh sinh viên QH-2020-I/CQ, khoa Công nghệ thông tin với đề tài “Retrieving legal document and extracting answer with BERT-based model” mang tính ứng dụng thực tiễn cao đã xuất sắc đạt giải Nhất tại Hội nghị sinh viên NCKH cấp trường lần thứ 19, cũng như vinh dự được Trung tâm hợp tác Công nghệ thông tin Hàn Quốc – Hà Nội trao giải thưởng tại Hội nghị.
Chia sẻ lý do lựa chọn đề tài và quá trình thực hiện nghiên cứu khoa học, Nguyễn Tấn Minh luôn cảm thấy tự hào khi “đứa con tinh thần” mà mình nuôi dưỡng, ấp ủ được đón nhận, đánh giá cao. Hơn thế, hành trình theo đuổi con đường nghiên cứu khoa học với không ít khó khăn, thách thức đã giúp nam sinh học hỏi và tích lũy được nhiều bài học quý giá.
Công ty Korea IT Cooperation Center – Hanoi trao giải thưởng cho đề tài: “Retrieving legal document and extracting answer with BERT-based model”
Hãy cùng gặp gỡ sinh viên Nguyễn Tấn Minh, để cùng hiểu hơn về quá trình chinh phục giải thưởng cao nhất tại Hội nghị sinh viên NCKH cấp trường của UET nhé!
PV: Lý do nào khiến em lựa chọn nghiên cứu đề tài: “Retrieving legal document and extracting answer with BERT-based model” (tên tiếng Việt là, “Truy hồi văn bản luật pháp và trả lời câu hỏi sử dụng mô hình ngôn ngữ BERT”)?
Em bắt đầu nghiên cứu và học tập tại Phòng thí nghiệm Khoa học dữ liệu và Công nghệ tri thức (DS&KTLab) từ năm thứ 2, sau khi phát hiện bản thân có đam mê với nghiên cứu. Em được các thầy cô phòng thí nghiệm dìu dắt khám phá những kiến thức mới trong quá trình nghiên cứu khoa học. Sau 1 năm tham gia nghiên cứu tại phòng thí nghiệm, em nhận thấy đề tài “Truy hồi văn bản luật pháp và trả lời câu hỏi sử dụng mô hình ngôn ngữ BERT” có ý nghĩa về nghiên cứu và ứng dụng.
Đề tài này đã “gắn bó” với em từ năm thứ hai đại học, khi em và nhóm nghiên cứu tại phòng thí nghiệm đã bắt đầu theo đuổi ứng dụng công nghệ vào lĩnh vực pháp luật. Ban đầu, em được thầy cô giới thiệu về cuộc thi “Phân tích văn bản luật tự động” năm 2022, nằm trong khuôn khổ hội thảo khoa học quốc tế “Kỹ thuật tri thức và hệ thống” (KSE 2022) – cuộc thi chuyên về xử lý ngôn ngữ tự nhiên trong lĩnh vực pháp luật, nhóm em đã tham gia với đề tài “Truy hồi văn bản luật pháp và trả lời câu hỏi sử dụng mô hình ngôn ngữ BERT” và đạt giải Nhì bài toán Hỏi đáp về luật pháp, giải Ba bài toán Truy hồi văn bản luật pháp tại cuộc thi. Có thể nói, đề tài là kết quả nghiên cứu đầu tiên của em cùng các thành viên trong nhóm tại cuộc thi.
Đây chính là “cú hích” động viên tinh thần rất lớn cho em và nhóm nghiên cứu bởi đó là kết quả đầu tiên mà nhóm nghiên cứu được ghi nhận. Vì thế, không chỉ dừng lại ở cuộc thi này, em đã tiếp tục theo đuổi lĩnh vực và phát triển đề tài tham dự Hội nghị sinh viên nghiên cứu cấp khoa và cấp trường.
Em cảm thấy rất vui mừng và tự hào về những thành tích mà bản thân đạt được tại Hội nghị, những thành tích này đã “tiếp lửa” cho em thêm tự tin theo đuổi đam mê trong tương lai. Đặc biệt là phát triển đề tài nghiên cứu thành những phần mềm được ứng dụng trong lĩnh vực pháp luật.
Nguyễn Tấn Minh trình bày kết quả nghiên cứu trước Hội đồng
PV: So với những công nghệ hiện nay, đề tài này có những điểm mạnh hỗ trợ người dùng như thế nào trong lĩnh vực pháp luật?
Hiện nay, Việt Nam chưa có nhiều công cụ tích hợp trí tuệ nhân tạo để hỗ trợ con người giải quyết các công việc pháp lý. Vì vậy, đề tài đề xuất phương pháp kết hợp nhiều mô hình mạnh mẽ (học máy, học sâu) để giải quyết bài toán giúp em nghiên cứu đạt được những kết quả tốt. Ngoài ra, em còn sử dụng kiến thức miền trong lĩnh vực pháp luật ví dụ xác định các thông tin quan trọng của một văn bản dựa trên cấu trúc, mối quan hệ trong văn bản pháp lý, để tăng độ chính xác của mô hình. Từ đó, em đưa ra các giải pháp cho bài toán truy xuất văn bản và hỏi – đáp về pháp luật. Từ những nghiên cứu và thực nghiệm, chúng ta có thể phát triển những công cụ tích hợp trí tuệ nhân tạo, giúp giải quyết các công việc pháp lý như tìm kiếm tài liệu, dịch vụ tư vấn về luật pháp…
Với một câu truy vấn và cơ sở dữ liệu về các bộ luật cho trước, các mô hình BERT sẽ đưa ra mã điều luật, bộ luật liên quan và câu trả lời cho câu truy vấn đó. Từ đó, giúp người dùng có những trải nghiệm tích cực hơn trong việc tìm hiểu về lĩnh vực pháp luật. Việc áp dụng các công cụ ứng dụng trí tuệ nhân tạo còn giúp nâng cao hiệu quả công việc, tiết kiệm chi phí, thời gian và nhân lực.
Đề tài sẽ tạo ra những phần mềm không chỉ hỗ trợ các chuyên gia như: thẩm phán, luật sư,… mà còn giúp người dùng thông thường tiếp cận gần hơn với các thông tin pháp luật chính xác, tin cậy. Các chuyên gia có thể sử dụng phần mềm để tìm kiếm tài liệu, văn bản pháp luật, soạn thảo hợp đồng… Đề tài còn có thể được ứng dụng để xây dựng dịch vụ tư vấn pháp lý, cung cấp câu trả lời cho người dùng. Ngoài việc nghiên cứu các bài toán xử lý ngôn ngữ tự nhiên trong lĩnh vực pháp luật, đề tài còn có tiềm năng ứng dụng cao trong lĩnh vực hành chính.
PV: Chắc hẳn, trong quá trình nghiên cứu khoa học, bên cạnh những thuận lợi, Tấn Minh chắc cũng gặp không ít những khó khăn, thách thức? Em có thể chia sẻ thêm về những điều đó không?
Khi bắt đầu thực hiện đề tài vào tháng 7/2022, kiến thức chuyên ngành, kiến thức miền của em còn nhiều thiếu sót. Em đã chủ động tìm hiểu, trau dồi kiến thức về học máy, học sâu và pháp luật. Ngoài ra, thầy cô và các bạn trong DS&KTLab đã hướng dẫn, hỗ trợ em trong quá trình nghiên cứu. Có thể nói, việc nghiên cứu một mình khiến cho em áp lực rất lớn về việc cân bằng giữa nghiên cứu và học tập. Em đã sắp xếp và tận dụng thời gian để xen kẽ giữa nghiên cứu với học tập, chủ động lên phòng thí nghiệm trao đổi với thầy cô hướng dẫn những hôm không có tiết học để đảm bảo tiến độ nghiên cứu. Chính thầy cô và bạn bè là những người đồng hành với em trong suốt quá trình nghiên cứu và cũng là “lợi thế” giúp em đạt được kết quả nghiên cứu như hiện nay.
Một trong những khó khăn, thách thức lớn mà em phải đối mặt, đó là khi nghiên cứu gặp lỗi hoặc kết quả thử nghiệm không mong muốn. Những lúc như vậy, em nhận được sự chỉ dẫn và động viên từ thầy cô hướng dẫn là PGS.TS Phan Xuân Hiếu và ThS. Vương Thị Hải Yến, để em nhận ra vấn đề và khắc phục nó. Những trao đổi hữu ích từ kiến thức, kinh nghiệm, đến sự ủng hộ, khích lệ của những người bạn sát cánh trong phòng thi nghiệm cũng giúp em tự tin, nỗ lực để phá bỏ rào cản, “bế tắc” trong quá trình nghiên cứu.
Tại UET, em đã tích lũy cho bản thân thêm nhiều kiến thức chuyên ngành, phương pháp làm việc hiệu quả khi nghiên cứu độc lập, kỹ năng thuyết trình… So với trước đây, em đã biết cách làm việc có hệ thống, phân tích và giải quyết vấn đề, cũng như rèn luyện thêm tính cẩn thận, kiên trì, không bỏ cuộc
PV: Trong thời gian tới, em đã có những dự định phát triển thêm về đề tài này như thế nào?
Hiện tại, em đang hoàn thiện đề tài chuẩn bị cho Hội nghị sinh viên nghiên cứu khoa học cấp ĐHQGHN. Em đã chỉnh sửa và hoàn thiện báo cáo đề tài theo những góp ý, phản biện của thầy cô, Hội đồng đánh giá các cấp. Ngoài ra, em vẫn tiếp tục nghiên cứu, mở rộng với các tập dữ liệu tiếng Anh, tiếng Nhật.
Cảm ơn Nguyễn Tấn Minh về những chia sẻ thú vị, chúc cho em luôn giữ được năng lượng tích cực, phong độ tốt nhất để tiếp tục bứt phá trong Hội nghị sinh viên NCKH của ĐHQGHN.
(UET-News)