“For You” đập ngay vào mắt khi bạn mở TikTok: một dòng vô tận các videos được lựa chọn theo gu của từng người dùng. Không có hai trang nào giống hệt nhau cả, và TikTok bùng nổ với hơn hai tỷ lượt tải về. Trang “For You” trở thành tài sản số đắt giá nhất trên thế giới. Được giới thiệu hay không trên trang này quyết định tương lai của các “KOL-Nhà ảnh hưởng” trên TikTok. Mấy năm qua hãng im lặng về thuật toán của trang, để mặc giang hồ đồn đoán âm mưu.
Và giờ thì TikTok lần đầu tiên vén màn. Trong một đăng tải trên blog ngày thứ Năm vừa rồi, công ty đã trình bày những nguyên lý cơ bản để trang 4U vận hành, làm cho người dùng đỡ phải thử sai mất thời giờ. Công ty tuyên bố, thuật toán sử dụng dựa trên một tập hợp phức tạp các tín hiệu có trọng số, để giới thiệu video, từ hashtag, bài hát, cho đến loại thiết bị mà người dùng sử dụng.
Blog này nằm trong một chiến dịch rộng hơn để thúc đẩy sự minh bạch của TikTok, trong bối cảnh các nghị sĩ Mỹ và người dùng quan ngại về mối quan hệ tiềm năng giữa công ty và chính quyền Trung Quốc. TikTok thuộc sở hữu của ByteDance, một người khổng lồ công nghệ của Trung Quốc. Tuy nhiên công ty thường xuyên phủ nhận việc Đảng CSTQ có ảnh hưởng lên các chính sách của mình, và tìm cách tách mình khỏi Bắc Kinh. Nhưng mối quan ngại không chấm dứt. Đầu tuần này, tạp chí WSJ cho biết, một số người dùng đã cố tình khen ngợi TQ và Tập Cận Bình để xem nền tảng có giúp các video này viral được ko?
Vậy hãy cùng nhau xem cơ chế TikTok đưa các video lên 4U. Khi có một video nào được tải lên TikTok, thuật toán 4U sẽ chọn ra một tập nhỏ các người dùng. Họ không phải là những người đang theo dõi tác giả, mà là những người 4U cho rằng sẽ thích video này, dựa trên các hành vi quá khứ của họ. Nếu tập người dùng này tỏ ra thích thú với video, ví dụ như xem hết, xem đi xem lại, share… 4U sẽ mở rộng tiếp ra những người dùng khác có quan tâm tương tự. Cứ thế lặp đi lặp lại, và đủ số vòng feedback, video sẽ trở thành viral. Trong trường hợp ngược lại, tập “lợn thử nghiệm” không thích thú, video sẽ chỉ được giới thiệu với càng ngày càng ít người dùng hơn.
Thuật toán trên giải thích tại sao trên 4U có những video có hàng tấn like và view, lẫn những video chỉ lèo tèo vài người thích. Kể cả người dùng mới, rất ít người follow vẫn có thể lên được 4U bình đẳng, mặc dù về lý thuyết, tác giả với lượng fan lớn vẫn có chút lợi thế. Blog công ty viết: “mặc dù rõ ràng là video của tác giả có lượng fan lớn sẽ nhận được nhiều views hơn, nhưng cả hai yếu tố “đếm fan” và thành tích quá khứ của tác giả, không phải là yếu tố trực tiếp của hệ thống giới thiệu 4U”
TikTok dựa trên một loạt các dấu hiệu để xác định xem video nào người dùng thích xem, một số có trọng số. Những dấu hiệu mạnh như bạn có xem hết không, có share không, có xem tiếp các video của cùng tác giả không. Một số dấu hiệu yếu như loại điện thoại, ngôn ngữ bạn dùng, có ở cùng một địa phương với tác giả không? TikTok phân tích cả các nhận xét tiêu cực như “không thích”, hoặc che nội dung với một số tác giả khác, hoặc đề xuất âm thanh đặc thù.
Khi video mới được công bố, được nhiên chỉ có những dấu hiệu yếu. TikTok nói là hệ thống sẽ cố gắng giới thiệu trong vòng ba tháng. Mặc dù trên thực tế, video sẽ viral rất nhanh sau khi khi được tải lên. Vì 4U không để dấu thời gian, người dùng sẽ không biết là video họ đang xem là mới hay cũ.
Thuật toán 4U còn xem xét các yếu tố khác, như bài hát, hashtag, lời tựa… để phân loại và giới thiệu. Bởi thế nên bạn có thể thấy một loạt các video với chung một ca khúc, giúp nuôi dưỡng một tập thính giả cho các nhạc sĩ mới và nhồi phần lời hấp dẫn vào đầu người xem. Hé lộ về việc 4U sử dụng hashtag như dấu hiệu, đã phần nào khẳng định một giải thiết của các tác giả là cứ nhét hashtag #foryou” vào là dễ viral hơn. Thực tế là các hashtag đều có giá trị như nhau, không phụ thuộc vào nội dung của hashtag.
TikTok thông báo họ duyệt tất cả nội dung để tìm các yếu tố phạm quy, ví dụ như hình ảnh khỏa thân, nhưng công ty khẳng định thuật toán 4U không quan tâm đến hình ảnh trên video hoặc cách mà video được ghi lại. Công ty cũng đính chính lại những cáo buộc của Intercept là trong các tài liệu nội bộ có hướng dẫn biên tập viên tìm cách dẹp video của những người xấu xí, nghèo hay khuyết tật. Công ty khẳng định đó chỉ là những quy tắc đã quá lạc hậu, hoặc không bao giờ được đưa vào ứng dụng.
Khái niệm “Thuật toán giới thiệu” chẳng mới mẻ gì ở Sillicon Valley, các đối thủ của TikTok đã dùng từ trước. Có điều dần dần họ bị sa vào bẫy, trở thành cái loa cho những ý tưởng thù hận, hoặc chỉ là tiếng vọng của chính mình. Ví dụ như Youtube đã phải điều chỉnh thuật toán dựa trên thời gian xem, vì thực tế, các thuyết âm mưu thu hút người xem lâu hơn. TikTok tuyên bố rằng thuật toán của họ khá phổ quát và không tối ưu dựa trên tiêu chí nào cả. Họ cũng thông báo rằng sẽ block những video chứa các thủ tục chữa bệnh hoặc giới thiệu các mặt hàng bị pháp luật kiểm soát.
TikTok cũng xác nhận một số thách thức khi thiết kế thuật toán, chẳng hạn rủi ro “bong bóng lọc”, dẫn đến người dùng bị xem đi xem lại một ý tưởng. Để tránh rủi ro này, TikTok thường xuyên giới thiệu các video hoàn toàn không giống những thứ họ đã xem trước đó. “Mục tiêu của chúng tôi là cân bằng giữa những sở thích của bạn và cơ hội khám phá những trải nghiệm mới mà thông thường bạn sẽ không có được.”
David Polgar, một nhà đạo đức công nghệ, thành viên của Hội Đồng Tư Vấn Nội Dung của TikTok, mới được thành lập hồi tháng ba vừa rồi, tuyên bố: “TikTok, như một nền tảng thông tin xã hội, nhận thức sâu sắc trách nhiệm của mình về việc ảnh hưởng đến chất lượng thông tin mà người dùng hấp thụ.”
Cũng cùng thời gian đó, công ty đã công bố mở cửa “Trung tâm Minh bạch TikTok” ở Los Angeles cho các chuyên gia bên ngoài có cơ hội thẩm định mã nguồn và trực tiếp quan sát cách TikTok quản trị nội dung.
Link bài gốc: https://www.wired.com/story/tiktok-finally-explains-for-you-algorithm-works/
Nguyễn Thành Nam (dịch giả)
Founder FUNiX là một trong 13 công thần sáng lập ra Tập đoàn FPT. Với chiến công lớn trong việc khai phá và phát triển xuất khẩu phần mềm cho Tập đoàn, anh Nam từng giữ chức CEO kiêm Chủ tịch HĐQT của FPT Software, kế đến là CEO FPT.
Nhắc đến “Nam già”, người ta nghĩ ngay tới vị thủ lĩnh phong trào của FPT, đồng thời là nhân vật biểu trưng cho văn hóa STCo FPT. Suy nghĩ khác người, nhiều mơ mộng, dí dỏm một cách thông thái và đặc biệt rất sáng tạo, anh Nam là dị nhân hàng đầu ở FPT. Với gần 30 năm kinh nghiệm trong lĩnh vực phần mềm và quản lý, hiện anh Nam vẫn được tín nhiệm ở vai trò Cố vấn sáng tạo FPT.