Phần mềm kiểm tra chính tả là một chương trình ứng dụng dùng để kiểm tra các lỗi chính tả, lỗi văn phạm, lỗi đánh máy trong văn bản. Các chương trình này có thể hoạt động độc lập, hoặc có thể là một add-ins bổ sung cho các chương trình xử lý văn bản như Microsoft Word, trình duyệt Chrome....
Trình tự xử lý của một phần mềm kiểm tra chính tả
Advertisement

- Quét văn bản
- Tuần tự so sánh văn bản với một danh sách các từ vựng đúng chính tả
- Tìm lọc các từ không tồn tại trong danh sách từ điển
- Tiến hành tái đánh giá dữ liệu một lần nữa, ví dụ như trong tiếng Anh các từ ở số nhiều, từ ở thì quá khứ....
- Tiến hành phân tích ngữ pháp
- Cuối cùng là thông báo các từ sai chính tả cho người dùng
Thuật toán của một phần mềm kiểm tra chính tả
Một trong những thuật toán đơn giản của phần mềm kiểm tra chính tả là giải thuật n-grams.
Độ chính xác của thuật toán n-grams trong việc phát hiện lỗi chính tả phụ thuộc vào từ điển, nghĩa là dung lượng từ điển càng lớn thì độ chính xác của phần mềm càng lớn.
Ngoài ra một phần mềm kiểm tra chính tả còn sử dụng thuật toán luật âm tiết để phát triển chức năng chỉnh sửa từ sai và đưa ra gợi ý thích hợp cho người dùng.
Lịch sử của phần mềm kiểm tra chính tả
Năm 1961, Les Earnest, một lập trình viên đã nghĩ ra ý tưởng viết một công cụ kiểm tra chính tả cho một danh sách hơn 10.000 từ vựng trên hệ thống máy tính lớn. Sau đó một thập niên, năm 1971, chàng sinh viên công nghệ Ralph Gorin đã tạo ra một chương trình ứng dụng kiểm tra lỗi chính tả tại trường Đại học Stanford.
Mãi đến những năm 1980, khi máy tính cá nhận được phổ biến, các phần mềm soạn thảo văn bản như WordStar, WordPerfect đã tích hợp chức năng kiểm tra chính tả tiếng Anh trên phần mềm của họ.
Và cho đến hiện nay thì ngoài các phần mềm soạn thảo văn bản có chức năng kiểm tra chính tả thì các trình duyệt web như Chrome, Opera cũng đã tích hợp thêm chức năng chính tả để phục vụ người dùng.
Phần mềm kiểm tra chính tả tiếng Việt
Tiếng Việt là một ngôn ngữ tương đối phức tạp nên việc cho ra đời một phần mềm kiểm tra chính tả chuẩn mực là chuyện rất nan giải.Từ trước đến nay có rất nhiều công cụ giúp soát lỗi chính tả tiếng Việt xuất hiện nhưng hầu hết đều hoạt động một thời gian rồi đột nhiên biến mất không tông tích.
Sau nhiều lần tìm kiếm một phần mềm chính tả để sử dụng, đội ngũ Tummosoft nhận thấy tại Việt Nam không có một phần mềm nào có thể trợ giúp tương đối trong việc xử lý văn bản tiếng Việt nên đã quyết tâm xây dựng Tummo Spell.
Tummo Spell được thiết kế từ năm 2014, sau nhiều lần tìm kiếm thuật toán để giải cho được bài toán xử lý ngôn ngữ tiếng Việt thì đến năm 2017 thì phần mềm đã hoạt động tương đối ổn định.
Dù gặp nhiều khó khăn nhưng mỗi năm Tummo Spell đều tiến hành nâng cấp để công cụ kiểm tra chính tả ngày càng được hoàn thiện hơn.
Bạn có thể tài về phần mềm kiểm tra chính tả tiếng Việt Tummo Spell tại đây.