Đừng coi thường dân đen

Thông tin sai lệch trên mạng thường bùng nổ theo một kịch bản cố định. Đầu tiên một tin được viral. Sau là cãi nhau như mổ bò. Rồi ban quản lý can thiệp. Rồi ai đó bênh “Thế báo Tuổi Trẻ cũng đăng thế đấy” Cuối cùng có bậc cao nhân đầy hiểu biết điềm đạm chỉ ra: vấn đề thực sự của mạng xã hội không phải là câu chuyện “giả” kia do ai viết mà là “thuật toán bí ẩn” xác định xem ai có thể xem và lan truyền câu chuyện đó.

Đúng thế, thuật toán được thiết kế để tối đa likes, còm, share của bản tin, chứ không phải là độ chính xác. Các câu chuyện bịa thường lại được nhiều người quan tâm hơn. Bởi thế, tóm lại, cần phải sửa cái thuật toán kia, chứ không phải là chỉ gỡ bài xuống.

Nhưng sửa thế nào? Để xếp hạng câu chuyện thật trên chuyện giả, hệ thống phải có một cách nào đó liên tục đánh giá tất cả những thông tin được chia sẻ, hay ít nhất những thông tin có lượng người theo dõi lớn. Cách làm truyền thống hiện nay là thuê bên thứ ba nào đó. Ví dụ như Facebook hợp tác với các tổ chức kiểu Factcheck.org để xác định xem liệu có nên cảnh báo về một đường link nào đó không. Twitter cũng thế. Nhưng người làm thì sao quy mô được như thuật toán. Đơn giản là không đủ số lượng những chuyên gia kiểm chứng để kiểm tra tất cả những gì được đưa lên mạng xã hội. Tệ hơn, nó còn tạo ra cái gọi là “hiệu ứng ngụ ý sự thật”. Tức là nếu bạn chỉ đọc một tập nhỏ các tin để đánh dấu cảnh báo, có thể tạo cho người đọc cảm giác tất cả các tin còn lại không được cảnh báo là chính xác. Mặc dù thực tế đó là những tin không ai kiểm tra cả.

Một bài báo mới công bố trên tạp chí Science Advances, đã đưa ra một lời giải khá thú vị: sử dụng đám đông để kiểm tra độ tin cậy của tin tức. Nhóm nghiên cứu do giáo sư MIT David Rand lãnh đạo đã chỉ ra rằng, một nhóm những người vô danh tiểu tốt (dân đen) được chọn ngẫu nhiên có thể đánh giá chính xác tương đương với các chuyên gia kiểm chứng.

Họ chọn ra 207 tin bị AI của Facebook đánh dấu là cần kiểm tra. Sau đó để 3 chuyển gia kiểm chứng đánh giá, theo một số tiêu chí, rồi xếp hạng từ 1 (hoàn toàn bốc phét) đến 7 (hoàn toàn tin cậy). Sau đó họ tuyển khoảng 1100 nhân viên bình thường từ “Chợ người” của Amazon, chia họ thành từng nhóm, cân bằng theo xu hướng chính trị tự khai, và cũng đánh giá như các chuyên gia, chỉ có khác là: trong khi các chuyên gia phải đọc hết bài và nghiên cứu để đưa ra nhận định của mình, thì các “dân đen” chỉ cần đọc tiêu đề và câu đầu tiên của bài báo.

Thật là kinh ngạc, khi thấy đánh giá của đám đông là tương đương, thậm chí tốt hơn các chuyên gia.

Để đo hiệu quả của đám đông, các nhà nghiên cứu đầu tiên đo sự tương quan giữa đánh giá của 3 chuyên gia và nhận được hệ số tương quan là 0.62, (khá cao, nhưng còn xa mới có thể gọi là thống nhất, có thể hiểu thế này, nếu đánh giá một câu chuyện theo thang đúng/sai thì ít nhất có 2 trong 3 người đồng ý với nhau trong 90% trường hợp). Sau đó họ tính hệ số tương quan giữa điểm của đám đông và trung bình điểm của 3 chuyên gia, với giả thiết là trung bình chắc là tốt hơn từng chuyên gia riêng lẻ. Và nếu hệ số này càng gần với hệ số tương quan của 3 chuyên gia với nhau, thì có thể nói là đám đông làm việc tốt tương đương hoặc hơn các chuyên gia. Vấn đề là ta cần bao nhiêu “dân đen” để đạt đến ngưỡng đó?

Các nghiên cứu chỉ ra rằng, chỉ cần một nhóm 8 người là có thể đánh giá “chân lý” với sai lệch không đáng kể so với các chuyên gia thẩm định. Với 22 người thì kết quả vượt trội. (Đây là trong trường hợp những dân đen này được biết nguồn tin. Nếu dấu nguồn thì kết quả tệ hơn một chút). Quan trọng nhất là đám dân đen hơn hẳn chuyên gia khi đánh giá các tin được coi là “chính trị”. Kiểm chứng những tin này luôn là nỗi đau đầu của các chuyên gia.

Nghe thật có vẻ khó tin là một nhóm dân đen ngẫu nhiên, chỉ dựa vào tiêu đề, câu đầu tiên và nơi xuất bản, lại có thể hơn được những chuyên gia thẩm định được đào tạo bài bản. Nhưng đó chính là ý tưởng căn bản của trí tuệ đám đông: “nếu có đủ người, đủ độc lập, ý kiến của họ sẽ đánh bại chuyên gia”.

Rand nói: tôi đồ là thế này, khi bắt đầu đọc bài, mọi người đều tự hỏi, cái này sẽ nằm vào đâu trong số những gì mình đã biết nhỉ? Đó là khi trí tuệ đám đông bắt đầu được khởi động. Bạn không cần phải biết ý nghĩ của tất cả mọi người, chỉ cần lấy trung bình, loại nhiễu, là có thể nhận được tín hiệu rõ nét hơn bất cứ một cá nhân đơn lẻ nào.

Đó không phải là hệ thống thích/chê của Reddit, cũng không phải nguyên lý công dân tự biên tập như Wikipedia. Trong những trường hợp này, một tập nhỏ người đọc tự xưng, không đại diện, lại còn biết được ý kiến của nhau khi đánh giá một chất liệu. Thí nghiệm này cũng khác với chương trình Birdwatch của Twitter khuyến khích người dùng viết bài giải thích tại sao họ lại cho tin này là tin sai lệch. Trí tuệ đám đông chỉ được thể hiện khi nhóm đủ đa dạng, ngẫu nhiên, và cho ý kiến độc lập với nhau.

Nghiên cứu kết luận rõ ràng: mạng xã hội như facebook, Twitter có thể sử dụng công nghệ đám đông để mở rộng việc kiểm tra tin tức ra qui mô rất lớn, giá thành hợp lý mà lại không ảnh hưởng đến chất lượng thẩm định. (dân đen được trả tầm $.9 ~ 20k VNĐ cho việc tham gia đánh giá một tin). Các tác giả còn cho rằng: cách làm này sẽ giúp phục dựng niềm tin của cộng đồng vào nền tảng (theo một điều tra của Pew năm 2019, đa số các thành viên đảng cộng hòa tin rằng những chuyên gia thẩm định có thiên kiến trước.)

Câu hỏi thú vị là nếu đồng ý, các nền tảng mạng xã hội sẽ triển khai hệ thống này thế nào? Sẽ cấm các bài báo bị đánh dấu? Có những bài báo rõ ràng là không có tý tin giả nào, nhưng rõ ràng là có ý định dẫn dắt và thao túng?

Các nhà nghiên cứu đề xuất, cần phải bỏ nguyên tắc nhị nguyên đúng/sai mà đưa “một thang điểm liên tục của đám đông” vào thuật toán xếp hạng. Những thông tin được đám đông cho rằng đáng tin cậy hơn sẽ được lên hạng để đề xuất cho người đọc, những thông tin bị điểm thấp sẽ ít được xuất hiện hơn.

Vì đám đông được yêu cầu đánh giá theo 7 chiều, bao gồm cả tính chắc chắn, khách quan và thiên kiến… nên hệ thống mới sẽ sắp đặt lại nội dung theo độ tin cậy, hơn là tìm cách giám sát rạch ròi giữa tin giả/tin thật.

Tất nhiên cách làm này cũng có những hạn chế. Chẳng hạn làm thế nào với các video, đang là nguồn tin giả lớn nhất. Hay với những tin không có nguồn. Đám đông tốt hơn các chuyên gia không có nghĩa là không có sai lầm vì các chuyên gia vẫn sai ầm ầm. Đánh giá chính xác là việc không tưởng. Nhưng chắc chắn còn những cách làm khác mà chúng ta chưa biết đến. Nhưng ít ra thì đưa trí tuệ đám đông vào thuật toán xếp hạng, sẽ làm cho các nền tảng trở nên đáng tin cậy với công chúng.

NTN dịch từ https://www.wired.com/story/could-wisdom-of-crowds-help-fix-social-media-trust-problem/ Của tác giả by https://www.wired.com/author/gilad-edelman

Nguyễn Thành Nam (dịch giả)

Founder FUNiX là một trong 13 công thần sáng lập ra Tập đoàn FPT. Với chiến công lớn trong việc khai phá và phát triển xuất khẩu phần mềm cho Tập đoàn, anh Nam từng giữ chức CEO kiêm Chủ tịch HĐQT của FPT Software, kế đến là CEO FPT.

Nhắc đến “Nam già”, người ta nghĩ ngay tới vị thủ lĩnh phong trào của FPT, đồng thời là nhân vật biểu trưng cho văn hóa STCo FPT. Suy nghĩ khác người, nhiều mơ mộng, dí dỏm một cách thông thái và đặc biệt rất sáng tạo, anh Nam là dị nhân hàng đầu ở FPT. Với gần 30 năm kinh nghiệm trong lĩnh vực phần mềm và quản lý, hiện anh Nam vẫn được tín nhiệm ở vai trò Cố vấn sáng tạo FPT.

Nếu bạn thấy hay, vui lòng chia sẻ

Nguyễn Thành Nam (dịch giả)

Trả lời Hủy