DMCA.com Protection Status

Phần mềm chống đạo văn

Sức mạnh của bất kỳ một phần mềm chống đạo văn nào nằm ở cơ sở dữ liệu lớn và năng lực tìm kiếm (công nghệ và thuật toán) nhanh, chính xác của nó. Kể từ khi Turnitin thiết kế tính năng kiểm tra tính tương đồng, chấm điểm trực tuyến và đánh giá ngang hàng thành một dịch vụ duy nhất vào năm 2010, thế giới đã ghi nhận sự phát triển của nhiều phần mềm chống đạo văn (tên gọi trong giới học thuật, còn thông thường mọi người vẫn gọi là phần mềm check đạo văn hay phần mềm kiểm tra đạo văn).

1. Turnitin định hướng tiêu chí đánh giá phần mềm chống đạo văn

Một số phần mềm khá nổi tiếng như Plagium, Small SEO Tools, Plagiarism Checker X… cung cấp khả năng check đạo văn miễn phí ở mức độ nhất định (thường tính cho số từ), cho phép kiểm tra mức độ tương đồng. Tuy nhiên, đây là những ứng dụng ra đời sau, hơn nữa lại có cơ chế khác nhau và quan trọng là không có hệ thống cơ sở dữ liệu đủ lớn để đối chiếu với tài liệu gốc kiểm tra.

Trong khi đó, Turnitin được định hướng phát triển cho lĩnh vực giáo dục sử dụng cơ sở dữ liệu bao quát trên phạm vi vô cùng lớn bao gồm bài làm, luận văn, sách, ấn bản học thuật và website, cùng với khả năng đối sánh nhanh chóng và chính xác đã tạo nên sự khác biệt mà khó có phần mềm chống đạo văn nào có thể so sánh được (xem bài viết Turnitin: Đơn giản là khác biệt để thấy những sự khác biệt). Đó là lý do những đại học, trường đại học, cơ sở giáo dục hàng đầu ở Việt Nam sử dụng Turnitin.

Thế nhưng, vào giai đoạn những năm 2015, các phần mềm kiểm tra đạo văn như Turnitin chỉ bán cho các tổ chức với số lượng tài khoản lớn trong khi người dùng cá nhân lại không thể tiếp cận, cùng với việc chưa thể tối ưu quá trình cho tiếng Việt. Chính vì những lý do đó mà Trường ĐH Công nghệ - ĐHQGHN đã triển khai xây dựng hệ thống kiểm tra trùng lặp cho người dùng Việt Nam, mang tên DoIT.

Theo Nguyễn Ngọc Sơn (2021, thành viên nghiên cứu chính) chia sẻ:

Bài toán này giống như bài toán của các công cụ tìm kiếm, tuy nhiên khác nhau ở chỗ, khi tìm kiếm trên Google, người dùng thường tìm những từ khóa ngắn và có thể lặp lại, trong khi đó hệ thống trùng lặp lại luôn phải xử lý những câu văn dài nên khó áp dụng được các phương pháp tối ưu truy vấn của công cụ tìm kiếm. Thêm vào đó, dung lượng tính toán cũng thường cao hơn nhiều so với các từ khóa ngắn.

DoIT là phần mềm chống đạo văn được thiết kế hệ thống dạng cân bằng tải nên tài liệu khi đưa vào hệ thống luôn luôn được đẩy vào danh sách xếp hàng đợi đến lượt kiểm tra. Ngoài ra, DoIT còn tích hợp khả năng kiểm tra chính tả, kiểm tra bài tập theo nhóm, hỗ trợ nhiều loại định dạng văn bản khác nhau và có thể áp dụng triển khai nội bộ. Đến đầu năm 2021, DoIT có khoảng hơn 300 triệu dữ liệu tiếng Anh và 50 triệu dữ liệu tiếng Việt nội sinh, khóa luận, luận văn, luận án… từ các trường đại học. Tuy nhiên tại Việt Nam, việc thuyết phục các đơn vị tham gia vẫn khá khó khăn do nhiều đơn vị lo ngại vấn đề bảo mật, mất mát dữ liệu. Hiện ngoài các trường trong ĐHQGHN, thì có thêm ba trường đại học khác hợp tác chia sẻ dữ liệu nội sinh cùng DoIT. Hệ thống DoIT xử lý hàng nghìn tài liệu cùng với với tốc độ xử lý trung bình cho khoảng 50 trang là 1 phút.

Gần đây, với sự phát triển cực kỳ nhanh chóng của các ứng dụng AI thì công việc của các nhà phát triển nội dung đang dần trở nên thuận lợi hơn. Nhưng vẫn có những ý kiến trái chiều về việc sử dụng AI trong nghiên cứu và học thuật. Nhằm phát hiện những nội dung được viết nên bởi những ứng dụng AI thì các phần mềm chống đạo văn cũng phát triển tính năng check AI nhằm phát hiện những nội dung này. Turnitin, Small SEO Tools, Dupli Checker, Plagium… là những phần mềm cung cấp tính năng check nội dung được viết từ ứng dụng AI (nhưng vấn đề này chưa được nhiều trường đại học quan tâm nhiều).

Như vậy, tiêu chí để đánh giá phần mềm chống đạo văn đó chính là:

  1. Cơ sở dữ liệu lớn (bài làm, sách, ấn bản học thuật và website);
  2. Khả năng tìm kiếm nhanh chóng;
  3. Kết quả đáng tin cậy.

Ngoài ra, phần mềm còn phải cung cấp các thông tin về:

  • Báo cáo tỉ lệ phần trăm tương đồng/đạo văn bên cạnh tỉ lệ độc nhất;
  • Kết quả báo cáo theo danh sách, theo câu;
  • Chế độ xem tài liệu được đánh dấu;
  • Tính năng tài liệu so sánh với nội dung bị đạo văn…

Nếu bạn cho rằng còn những tính năng cần thiết mà một phần mềm chống đạo cần phải có thì hãy chia sẽ ở phần BÌNH LUẬN dưới bài viết này để mọi người cùng tham khảo nhé!

Sau đây là tổng kết các phần mềm chống đạo văn do chúng tôi đề xuất (file excel), qua đó cũng thấy được một số tính năng như khả năng check đạo văn miễn phí hay check đạo văn AI… (tham khảo file pdf)

[Nguồn: nghiencuukhoahoc.edu.vn, 2023]

Hình 1. Phần mềm chống đạo văn thông dụng

Bây giờ, chúng ta sẽ cùng đi vào phân loại các phần mềm để sử dụng vào những mục đích cụ thể.

2. Phần mềm chống đạo văn chuyên dùng cho nhà nghiên cứu, học thuật

Turnitin với khả năng của mình đã nhận được sự tin tưởng của các nhà nghiên cứu trên thế giới nói chung cũng như các cơ sở giáo dục tại Việt Nam. Đến hiện tại, Turnitin chính là chuẩn mực cho những phần mềm chống đạo văn chuyên nghiệp, chính vì thế nên Turnitin là phần mềm xuất hiện đầu tiên trong danh sách này.

DoIT, ViperPlagiarismChecker.co với cơ sở dữ liệu được định hướng gồm các bài làm, sách, ấn bản học thuật và website cũng phù hợp cho các nhà nghiên cứu, học thuật.

Tuy nhiên, hạn chế của Turnitin là người dùng cá nhân không thể mua tài khoản, đồng thời tổ chức sử dụng cũng phải mua với mức phí lớn; DoIT thì chỉ cung cấp cho sinh viên, giảng viên thuộc hệ thống đơn vị nội bộ; Viper thì không có tính năng check đạo văn miễn phí; duy nhất PlagiarismChecker.co cho phép check miễn phí đến 800 từ.

Nhưng bù lại, tổ chức (như trường đại học) sau khi mua gói dịch vụ của Turnitin có thể phân bổ cho nhiều giảng viên ở các khoa sử dụng (dạng tài khoản Instructor) và mỗi tài khoản giảng viên này có thể tạo thêm đến 100 tài khoản sinh viên (dạng tài khoản Student) để phục vụ cho nhiều lớp, nhiều môn học, bài tập khác nhau.

Mời các bạn tham khảo hướng dẫn sử dụng Turnitin cho giảng viên (tài khoản Instructor):

3. Phần mềm chống đạo văn dùng cho nhà quản lý, phát triển nội dung

Tiếp theo là Small SEO Tools, Grammarly, Smodin, Search Engine Reports, Dupli Checker, PlagiarismChecker.me, Plag Scan, Plagium, Paper Rater, Plagiarism Checker X, Kiemtradaovan.com… sử dụng cơ sở dữ liệu từ hệ thống các website nên chắc chắn kết quả báo cáo cũng có phần hạn chế. Lợi thế lớn của những phần mềm này là cho phép check đạo văn miễn phí ngay trực tiếp trên website với số lượng khoảng 1000 từ, cá biệt có Smodin lên đến 1500 từ hoặc Plagiarism Checker X (phải cài đặt phần mềm) chỉ với khoảng 120 từ. Đây là tính năng giúp nhóm các phần mềm này phù hợp với các nhà quản lý, phát triển nội dung kiểm tra nhân viên khi sản phẩm của họ thường là những bài viết phục vụ mục đích marketing có số lượng từ khoảng 800 đến 1000 từ/bài viết.

Nhóm những phần mềm này cũng thường cung cấp các API cho các bên thứ ba có nhu cầu (như Small SEO Tools, Dupli Checker, Plag Scan, Plagium) và thậm chí là có Plugin WordPress như trường hợp của Small SEO Tools, và đặc biệt là khả năng check đạo văn AI (như Small SEO Tools, Smodin, Dupli Checker, Plagium).

4. Phần mềm chống đạo văn dành cho nhà quản trị website

Điểm chung của nhóm phần mềm dùng cho các nhà quản lý, phát triển nội dung là tiếp nhận nguồn vào ở dạng từ hoặc file, cá biệt có Plagiarism Checker X tiếp nhận dạng link web và điều này đặc biệt hữu dụng cho những nhà quản trị website hoặc nhà quản lý nội dung muốn kiểm tra nhanh chóng cả bài biết từ link web mà không cần quan tâm đến số lượng từ trong nội dung bài viết.

Copy ScapeDMCA Scan được sinh ra để dành riêng cho mục đích này. Đặc biệt, DMCA Scan giúp nhà quản trị website có thể đánh dấu bản quyền website và bài viết, nếu có đối thủ copy nội dung bài viết của mình thì nhà quản trị website có thể khiếu nại nhằm yêu cầu đối thủ gỡ bài viết vi phạm bản quyền.

Ngoài những phầm mềm chống đạo văn thông dụng trên thì có thể bạn chưa biết, trước năm 2010, Google Search được sử dụng rất phổ biến để kiểm tra vấn đề đạo văn. Google sử dụng các Googlebot để có thể trích lọc nội dung từ mọi danh mục trang web và gửi về máy chủ của Google để phân tích và xếp hạng theo thuật toán RankBrain. Người kiểm tra sẽ chọn ngẫu nhiên 10 đến 20 câu (phụ thuộc độ dài bài viết) để nhập vào thanh tìm kiếm (Trần Thị Thùy và Nguyễn Hoàng Nhi, 2021). Kết quả trả về trùng khớp hoàn toàn/trùng khớp vài từ/không trùng khớp sẽ dễ dàng được người kiểm tra nhận thấy. Tuy nhiên, Google Search chỉ là một “giải pháp tình thế lỗi thời” trước khi các phần mềm chống đạo văn trở nên thông dụng và hiện tại là khả năng check đạo văn AI ra đời.

Nếu bạn có những thảo luận hay biết những phần mềm chống đạo hay ho hơn nữa thì đừng ngần ngại chia sẽ ở phần BÌNH LUẬN dưới bài viết này để mọi người cùng tham khảo nhé!

Tài liệu tham khảo

  1. Mỹ, H. (2021). DoIT: Công cụ phát hiện đạo văn cho tiếng Việt. Đại học Quốc gia Hà Nội, truy suất từ https://www.vnu.edu.vn/ttsk/?C1654/N27741/DoIT:-Cong-cu-phat-hien-dao-van-cho-tieng-Viet.htm, ngày 01 tháng 11 năm 2023.
  2. Trần Thị Thùy và Nguyễn Hoàng Nhi (2021). Nghiên cứu so sánh kỹ thuật của chương trình chống đạo văn miễn phí hiện nay. Tạp chí Khoa học và Kinh tế phát triển – Trường Đại học Nam Cần Thơ, 12(), 3-19.

 

Kết thúc.


Tin tức liên quan

Đạo văn là gì?
Đạo văn là gì?

Thông thường, mọi người thường nghĩ đạo văn là vấn đề sao chép tác phẩm hoặc mượn ý tưởng của người khác, nhưng nếu chỉ "sao chép" và "mượn" thì chưa đủ để nói lên tính nghiêm trọng của vấn đề.

TỔNG HỢP PHẦN MỀM THỐNG KÊ DỮ LIỆU
TỔNG HỢP PHẦN MỀM THỐNG KÊ DỮ LIỆU

Các phần mềm thống kê hỗ trợ cho quá trình phân tích định lượng như SPSS, AMOS, EVIEWS, MINITAB, STATA, SmartPLS... và hỗ trợ biểu diễn như VISIO, MathType.

PHÂN TÍCH ĐỘ TIN CẬY THANG ĐO CRONBACH’S ALPHA
PHÂN TÍCH ĐỘ TIN CẬY THANG ĐO CRONBACH’S ALPHA

Cronbach’s Alpha (α) là hệ số cho phép nhà nghiên cứu phân tích mức độ tin cậy của việc thiết lập một “biến tổng hợp” trên cơ sở nhiều “biến đơn” của thang đo.


Bình luận
  • Đánh giá của bạn
Đã thêm vào giỏ hàng