Tìm hiểu về mô hình Word2Vec và ứng dụng xử lý cho dữ liệu tiếng Việt
Abstract
Từ xa xưa, con người ta đã sử dụng ngôn ngữ là hình thức giao tiếp trong cuộc sống hằng ngày. Ngôn ngữ của con người là một hệ thống được xây dựng một cách đặc trưng để chuyển tải ý nghĩa, và không được tạo ra bằng bất cứ loại biểu hiện hình thể nào. Để thể hiện nội dung của mình muốn đề cập đến, chúng ta có thể sử dụng từ ngữ hoặc dấu hiệu để diễn tả, điều đó được thể hiện qua lời nói, chữ viết hoặc các hình ảnh. Với sự phát minh ra máy tính để trợ giúp con người trong rất nhiều các hoạt động trong đời sống, kinh tế, chính trị, xã hội, v.v. con người mong muốn bằng cách nào đó có thể dạy cho máy tính hiểu được thứ ngôn ngữ của mình để trong các bài toán để thực hiện hiệu quả những nhiệm vụ liên quan đến ngôn ngữ của như: tương tác giữa người và máy, cải thiện hiệu quả giao tiếp giữa con người với con người, hoặc đơn giản là nâng cao hiệu quả xử lý văn bản và lời nói. Với những yêu cầu đó, Xử lý ngôn ngữ Tự nhiên ra đời tập trung vào các nghiên cứu trên ngôn ngữ của con người.
Collections
- Đồ án tốt nghiệp CNTT [618]