Alexa có thể báo thời tiết. Siri kể được vài chuyện cười. Ở Trung Quốc, trợ lý ảo của iFlytek được người dùng yêu quí. Nhưng công nghệ cũng có thể giúp chính quyền nghe lén.
Julian Chen sinh ở Thượng Hải, năm 1937, năm George Orwell bị bắn vào cổ khi đánh nhau với phát xít ở Tây Ban Nha. Bố mẹ ông, một cô giáo dạy nhạc và một nhà hóa học đã cho ông vào học ở một trường của Giáo hội Thượng hải. Cũng như Orwell, Chen yêu ngôn ngữ. Ông học tiếng Anh, tiếng Nga và tiếng phổ thông, còn ở nhà thì nói phương ngữ Thượng Hải. Sau này ông còn học tiếng Pháp, tiếng Đức và tiếng Nhật. Năm 1949, Mao lên nắm quyền, còn Orwell xuất bản cuốn 1984, học ngoại ngữ trở nên nguy hiểm ở TQ. Cuối những năm 50s, trí thức bị hạ bệ, đưa đi lao động, thậm chí bị thủ tiêu. Chen, lúc đó đang là sinh viên của Đại học Bắc kinh, bị tống xuống nhà máy kính Bắc kinh.
Công việc của Chen là đẩy xe chở xỉ than đi đổ. Nhưng ông rèn luyện trí óc bằng cách lắng nghe các đồng nghiệp nói chuyện. Tối về ông viết sách về dân tộc học cho phương ngữ Bắc kinh. Ông hoàn thành cuốn sách vào năm 1960 nhưng bị bộ máy của Đảng tịch thu mất.
Sau khi Mao chết, cuộc sống của Chen thay đổi. Ông được quay về trường và năm 1979, vào tuổi 42, ông trở thành những người đầu tiên được ra nước ngoài học tập sau nhiều năm. Chen hoàn thành luận văn PhD về Vật lý tại Đại học Columbia, Mỹ và ở lại làm việc cho IBM. IBM lúc đó đang phát triển những phần mềm nhận dạng tiếng nói đầu tiên và năm 1994, họ muốn áp dụng cho tiếng Phổ thông. Chen xung phong vào dự án.
Ngay lập tức, ông nhận thấy rằng ở TQ phần mềm nhận dạng tiếng nói sẽ thay đổi hoàn toàn cách giao tiếp của xã hội chứ không chỉ là công cụ cho mấy nhân viên văn phòng. Hiện vẫn chưa có một cách dễ dàng để gõ hơn 50000 ký tự Hán trên bàn phím QWERTY và các lập trình viên phải đi đường vòng. Người dùng sẽ gõ phiên âm (pinyin) rồi máy tính sẽ hiện lên một số ký tự để người dùng chọn. Ví dụ như để gõ chữ “con mèo”, người dùng gõ “m-a-o” rồi chọn 猫 từ danh sách các chữ, bao gồm những chữ khác như “buôn bán” hoặc “mũ” hoặc họ của Mao Chủ tịch, nhưng có cùng âm pinyin. Bởi tiếng Phổ thông có quá nhiều từ đồng âm, gõ bàn phím trở thành một bài tập chọn chữ nhàm chán.
Để xây dựng lõi của phần mềm đọc, Chen chia ngôn ngữ thành những đơn vị nhỏ nhất gọi là âm vị, rồi thuê 54 người Hoa đang sống ở NewYork hàng ngày đọc Nhân dân Nhật báo và ghi âm lại. Văn phòng IBM ở Bắc kinh cũng lấy mẫu từ 300 người đọc nữa. Tháng 10/1996, Chen bay về Bắc kinh để giới thiệu phần mềm của mình có tên là ViaVoice.
Trong một căn phòng lòe loẹt đầy người, Chen đã đọc to một tờ báo, vài tờ giây sau, nội dung bài báo được hiện lên màn hình lớn. Khán phòng há mồm kinh ngạc. Một nữ nghiên cứu viên giơ tay và nói rằng cô muốn phát biểu. Chen đưa mic và đám đông lại ồ lên. ViaVoice hiểu cả cô này.
ViaVoice chính thức ra mắt ở TQ năm 1997 với khẩu hiệu “Máy tính hiểu tiếng Phổ thông, ý nghĩ không cần tay”. Đích thân chủ tịch Giang Trạch Dân ngồi demo. Và chẳng bao lâu tất cả các máy PC ở TQ đều cài sẵn ViaVoice. Chen nhớ lại “Chúng tôi một mình một chợ,”.
Nhưng một số nhà khoa học ở lại TQ khó chấp nhận việc 1 công ty Mỹ lại tiên phong trong việc làm chủ tiếng Tàu. Họ muốn bắt kịp.
Trong số đó có Lưu Thanh Phong, một nghiên cứu sinh về nhận dạng tiếng nói 26 tuổi ở Đại Học Khoa học và Công Nghệ Trung Hoa (USTC) đóng tại Hợp Phì (tỉnh An Huy). Từ năm 1999, Lưu thành lập công ty iFlytek, mục đích là khôi phục danh dự của Trung Hoa, cạnh tranh với IBM và các hãng nước ngoài khác. Họ chuyển ra ngoài campus của USTC nhưng vẫn ở Hợp Phì để sử dụng nguồn nhân lực tài năng của USTC.
Khi Lưu trình bày quan điểm của mình cho Lý Kai-Fu, giám đốc nghiên cứu châu Á của Microsoft, Lý khuyên cậu nên từ bỏ tham vọng đối đầu với các địch thủ hùng mạnh trong lĩnh vực này của Mỹ như IBM, Microsoft, BellSouth, Dragon, và Nuance (tách ra từ Phòng thí nghiệm phi lợi nhuận SRI). Các công ty Trung quốc đã bị tụt hậu quá xa.
Lưu không nghe lời Lý. Anh thừa biết lĩnh vực này quá cạnh tranh, nhưng anh có tham vọng mang tính đạo đức: “Tiếng nói là nền tảng của văn hóa, là biểu tượng của dân tộc. Chúng ta không thể để các công ty nước ngoài bóp họng được. Ai không đồng ý với chiến lược tập trung vào điện toán giọng nói, có thể rời công ty.” Để bắt đầu iFlytek hợp tác với Huawei tự động hóa trung tâm hỗ trợ khách hàng, khách hàng có thể dùng giọng nói để ra lệnh thay vì bấm phím loằng ngoằng. Nuance cũng có được một lĩnh vực kinh doanh lành mạnh bằng mô hình này.
iFlytek ra mắt thị trường chứng khoán năm 2008. Năm 2010, công ty giới thiệu sản phẩm đại chúng iFlytek Input. Cũng năm đó, Apple giới thiệu Siri, một sản phẩm do SRI phát triển và bị Apple mua lại. Nhưng nếu Siri định vị như “trợ lý ảo” cố gắng trả lời tất cả các câu hỏi của ông chủ, thì Input rất tập trung. Người dùng có thể đọc các văn bản mọi chỗ trên điện thoại của mình: email, lướt web, và trên super app WeChat.
Như mọi công nghệ học từ giao tiếp với người, chất lượng ban đầu của Input khá tệ, nhưng với dữ liệu càng ngày càng nhiều, độ chính xác của Input từ giọng nói sang văn bản tăng vọt.
Các đối thủ lập tức theo bước Input và Siri, Microsoft đưa ra Cortana, Amazon Alexa và Google Assistant. Nhưng khi iFlytek tung ra trợ lý ảo thế hệ 1 Yudian năm 2012, công ty đã tập trung toàn bộ sức mạnh AI của mình vào một thách thức khác: dịch thời gian thực từ các ngôn ngữ và phương ngữ khác nhau. Phiên bản cuối cùng của Input cho phép người dùng dịch trực tiếp các cuộc hội thoại trên điện thoại từ 4 ngôn ngữ và 23 phương ngữ tiếng TQ. Với lượng dân số khổng lồ, việc tập trung vào dịch thuật đã giúp công ty thu được một lượng dữ liệu khổng lồ.
Người Mỹ có thể cần Alexa hoặc Google Assistant trong các yêu cầu đặc biệt, còn ở TQ, người Tàu để Input dẫn dắt mình trong suốt cuộc nói chuyện. Thỏa thuận riêng tư của công ty cho phép họ thu nhập các dữ liệu cá nhân vì “an ninh quốc gia”. Dữ liệu giọng nói ở TQ khá hay bị rò rỉ. Chẳng hạn nhà môi giới Data Tang, miêu tả trên website của mình một data set với gần 100000 mẫu hội thoại của các trẻ từ 3-5 tuổi.
Năm 2017, MIT xếp iFlytek vào danh sách 50 công ty thông minh nhất thế giới. Còn chính phủ Trung quốc xếp họ vào danh sách “đội tuyển AI quốc gia” cùng với các đại gia như Baidu, Alibaba và Tencent. Sau đó iFlytek ký 1 thỏa thuận hợp tác 5 năm với Phòng thí nghiệm AI và Khoa học Máy tính của MIT (CSAIL). Công nghệ dịch của iFlytek được câu lạc bộ Espanyon sử dụng và sẽ đảm bảo toàn bộ việc dịch thuật của Olympic mùa Đông năm 2022. Thị giá của iFlytek tại thị trường chứng khoán Thượng Hải vào hồi giữa tháng tư là $10.8 tỷ và công ty tuyên bố có 700 triệu người dùng ở Trung quốc.
Hai thập kỷ kể từ ngày Julian Chen ự đoán trong lễ ra mắt ViaVoice, đện toán giọng nói đã thay đổi hoàn toàn cách người ta giao tiếp với máy tinh ở TQ. Theo thống kê năm 2017, hàng ngày người dùng WeChat gửi khoảng 6 tỷ các tin nhắn thoại, tự nhiên, gần gũi, thoải mái chứ không phải suy nghĩ sắp xếp như thư điện tử thoại. iFlytek chế ra các máy tính bảng có khả năng tốc ký các cuộc họp kinh doanh, những máy ghi âm kèm theo ngay văn bản và các trợ lý tiếng nói cài đặt trên xe hơi trên toàn quốc.
Các sản phẩm dân dụng đại chúng rất quan trọng với iFlytek, nhưng khoảng 60% lợi nhuận công ty, theo báo cáo nửa năm 2019, liên quan đến “các dự án có sự tài trợ của chính quyền”. Ví dụ như “hệ thống trợ giúp điều tra tội phạm” hoặc “dữ liệu lớn cho chính quyền thành phố Thượng Hải”. Những dự án này cho phép công ty thâm nhập dữ liệu. Như các bản ghi âm ở tòa án, dữ liệu từ các trung tâm hỗ trợ khách hàng, và các dữ liệu an ninh khác. Ông chủ Lưu của iFlytek là đại biểu của Hội đồng Nhân dân Trung Hoa và có “quan hệ rất tốt với chính quyền”.
Lưu tin tưởng là điện toán giọng nói sẽ thâm nhập tất cả các ngõ ngách của xã hội. “Chúng sẽ tồn tại ở khắp nơi, thiết yếu như nước máy và điện.” Giấc mơ của Lưu hoàn toàn phù hợp với kế hoạch giám sát xã hội của Đảng.
Một ngày mua thu năm ngoái, tôi đã thử một thiết bị dịch của iFlytek có tên là Translator chạy chip Qualcomm Snapdragon, có thể làm việc off-line với hầu hết các ngôn ngữ trên thế giới, với một người đàn ông có tên là A Cheng. Ông Cheng và vợ sống ở một thành phố đông đúc miền nam Trung hoa, nhưng cách năm lại bay sang Trung tây nước Mỹ thăm gia đình. Để tập luyện, họ đi bộ ra siêu thị hàng sáng. Nhưng Cheng, người có thể diễn thuyết về văn hóa và nghệ thuật bằng tiếng Phổ thông, Quảng đông và Hakka, lại không nói được một từ tiếng Anh nào. Bởi thế đa phần thời gian ở Mỹ, ông buồn bã im lặng. Ông ta đúng là loại người cần Translator.
Tôi gặp Cheng ở giữa siêu thị, cạnh chiếc Chevrolet pickup cổ lỗ trang trí cỏ và hoa. Khi tôi nói với ông ta là Translator có giá $400, ông ta lắc đầu chê đắt. Nhưng khi chúng tôi ra quán Caribou Café ngồi nghịch tí toáy, thì ông ta thay đổi quan điểm, tỏ ra rất ngạc nhiên. Trong tiếng Phổ thông, Translator hiểu phát âm của ông ta “mingnisuda” là Minesota. Và đọc được tên tôi mặc dù ông ấy gọi thành “Mala”. Chuyển sang tiếng Anh, Translator và cả app Baidu trên máy ông Cheng đều hiểu ý câu “I’m feeling blue”, nhưng chỉ có Translator hiểu “I got up on the wrong side of the bed” là về cảm xúc của tôi chứ không phải chỗ vật lý mà tôi đặt chân. Kỳ diệu nhất là khi Cheng đọc 1 đoạn thơ của nhà thơ Trương Cửu Linh từ thế kỷ 18. Baidu dịch ra một câu vô nghĩa “At sea, the moon and the moon are at this time”, còn Translator dịch hẳn thành 2 câu thơ: “As the bright moon shines over the sea; / From far away you share this moment with me.“
Cheng còn rất ấn tượng khi Translator còn có thể hiểu được tiếng Quảng đông mặc dù kết quả nhiều khi vẫn ngô nghê (Translator hiểu một thành ngữ kiểu “tiếng Anh” thành “trại gà”).
Sứ mệnh của iFlytek đi xa hơn là giúp đỡ những doanh nhân, khách du lịch hay dân trung lưu thành thị. Họ còn tạo ra những sản phẩm cho các cộng đồng thiểu số không nói tiếng phổ thông, và xử lý các thổ ngữ địa phương. Năm 2017, họ khởi động chiến dịch “Kế hoạch Bảo vệ Phương ngữ”. Khi đọc được tin về vụ này, tôi đã phá lên cười vì liên tưởng đến tên của Orwell. CCP đã mất bao năm để tấn công các ngôn ngữ, hạ thấp vai trò của phương ngữ và tiếng của các dân tộc ít người, thả vào tiếng Phổ thông những từ vô nghĩa mang tính ý thức hệ (Nhà phê bình văn hóa Lý Đà đã gọi những từ như vậy là Maospeak, bắt chước Newspeak trong tác phẩm 1984 của Orwell). Giờ Đảng đã có các công ty công nghệ giúp sức.
Người phát ngôn của iFlytek tuyên bố, mục tiêu của chiến dịch này là “bảo vệ cách mà chúng ta giao tiếp”. Công ty cũng đặc biệt quan tâm đến tiếng Tân cương và Tây tạng, tiếng của các dân tộc địa phương đang bị Bắc Kinh theo dõi. Trung Hoa Nhật báo cho biết, trong một chương trình quảng cáo, người dân địa phương được khuyến khích nói tiếng mẹ để để đổi lấy iPhone.
Trụ sở iFlytek nằm xa trung tâm Hợp Phì. Hơn một nửa trong số 11000 nhân viên làm việc ở đây. Số còn lại nằm rải rác ở Trung quốc và trên thế giới. Cũng như các công ty ở Sillicon Valley, iFlytek cung cấp xe buýt, đồ ăn, giải trí miễn phí cho nhân viên và quảng bá những sứ mệnh tham vọng. Bạn có thể thấy khắp nơi, trên tường, trên quần áo, và cửa nhà xí xổm khẩu hiệu: “AI làm chủ thế giới”. Khi tôi đến đây mùa xuân năm ngoái, tôi còn nhìn thấy chân dung của Tập Cận Bình.
Người phát ngôn công ty dẫn tôi ra quán để nói chuyện quanh chén trà sữa trân châu. Tôi đã kiên trì gọi điện hàng giờ vào đường dây hỗ trợ khách hàng của công ty để có cuộc gặp gỡ này. Một cô gái tổng đài đã thương hại tôi và kết nối với người phát ngôn để cô này mời tôi đến công ty. Sau này tôi mới biết có người phát ngôn khác đã trả lời danh sách các câu hỏi được gửi đến đại diện truyền thông của iFlytek ở Mỹ là công ty Chartwell Strategy Group.
Tôi nhấm nháp các viên trân châu bột sắn trong quán nội thất gỗ hung vàng lắng nghe cô chủ giới thiệu các sản phẩm của công ty. Cô mặc váy bó liền với vest, đeo bông tai trông khá nguy hiểm và đi giày bệt, có vẻ như là gu thẩm mỹ của iF, dễ thương, kỳ dị, thậm chí hơi ngố. Con robot trẻ em của hãng Alpha Egg, mặc áo hoa chấm, có cái râu ăng ten ngắn và nói giọng của người ngoài hành tinh. Trợ thủ lái xe Flying Fish thì có hình hài một con cá mập đáng yêu mặc đồ lặn. Robot y tá tại bệnh viện thì giống như con để của C-3PO và EVE, cỗ máy trong bộ phim hoạt hình WALL-E. (Trần Tiểu Bình, giám đốc của trung tâm nghiên cứu AI thuộc USTC khẳng định: “dân Tàu có lẽ yêu robot nhất thế giới”). Người phát ngôn của iF giải thích cho tôi: tất cả các sản phẩm của iF nhằm mua vui và sự tiện lợi cho người dùng.
Ở TQ “buồn cười” cũng là một cách để chống đối, nhất là trong ngôn ngữ. Đầu những năm 2000, khi bộ máy kiểm duyệt cấm 1 số từ, người dùng máy tính liền lách bằng cách chế ra những từ đồng âm. Kiểu như “xã hội hài hòa”, một thuật ngữ tuyên truyền của Hồ Cẩm Đào, dân dùng chữ “cua sông” phát âm khá giống. Còn “phục vụ nhân dân” thì thành “hun khói nhân dân” …
Chính quyền không thích, ra lệnh cấm luôn cả các kiểu đồng âm và chơi chữ. Dân chống đối lại tìm đến các video với âm thanh, có thể sử dụng điện thoại để ghi lại và phân phối dễ dàng. Nhưng cuối thập kỷ đầu, Đảng đã quyết tâm làm chủ công nghệ nhận dạng giọng nói, cùng với sự phát triển của những công ty giọng nói dân dụng như iFlytek.
Năm 2009, Mạnh Kiến Trụ, bộ trưởng An ninh Công cộng, công du đến Hợp phì thăm trụ sở của iFlytek. Ở đây ông ta phát biểu nhấn mạnh “sự hợp tác giữa các cơ quan an ninh và các công ty công nghệ” để tạo ra những hệ thống “kiểm soát và ngăn ngừa tội phạm”. Đảng đã cài đặt hàng triệu camera, đưa ra hệ thống ID điện tử, đăng ký hộ khẩu trực tuyến và xây dựng các thành phố “thông minh”. Theo tổ chức Theo dõi Nhân quyền, công nghệ của iFlytek giúp chính quyền đưa các tín hiệu âm thanh vào hệ thống giám sát điện tử.
Công ty như iF là biểu tượng của chính sách “Kết hợp Dân-Quân” của chính quyền, khuyến khích các công ty công nghệ TQ tham gia nghiên cứu quân sự. Theo Elsa Kania, nhà nghiên cứu AI Trung quốc thuộc tổ chức New American Security, công ty đã bán các sản phẩm của mình cho PLA (Quân đội Trung quốc), và không rõ là có sự phân cách tường minh nào giữa bộ phận quân sự và dân sự trong công ty không! Người phát ngôn của iFlytek khi trả lời các câu hỏi thông qua Chartwell Group thì khẳng định công ty không phát triển các công nghệ quân sự và không bình luận về việc có chuyển giao các dữ liệu dân sự thu nhập được cho chính quyền không.
Theo Samantha Hoffman, nhà phân tích từ Viện Chính sách Úc ở Canbera, CCP (Đảng CS TQ) theo dõi các cuộc hội thoại không phải chỉ để kiểm duyệt mà còn “tìm cách xác định danh tính, các mối quan hệ xã hội, thói quen và xu hướng phát triển”. iFlytek có bằng sáng chế về việc tìm xác định đoạn audio và video nào đã bị sao chép, hay post lại trên mạng xã hội. Một đoạn miêu tả trong hồ sơ sáng chế nói “công nghệ này là 1 thành phần quan trọng của việc an ninh thông tin và theo dõi đám đông”. Công ty thì cho rằng phân tích các dữ liệu audio và video có thể giúp tìm các bài hát, xác định các cuộc gọi rác etc…
Nhưng iFlytek thực tế có làm các sản phẩm an ninh. Năm 2012, Bộ An ninh công cộng đã mua thiết bị của iFlytek để tiến hành thử nghiệm việc nhận dạng qua giọng nói tại An Huy. Dự án dựa trên một thiết bị có tên là Forensic Intelligent Audio Studio, gồm một máy tính có mic và loa! Giá khoảng $1700, có thể nhận dạng người qua giọng nói của họ – voiceprint – một dạng như vân tay. Tài liệu của công ty từ năm 2013, đã nhận định rằng “Voiceprint là số đo sinh trắc học duy nhất có thể nhận dạng được từ xa”, kèm thêm “trong quốc phòng, công nghệ này cho phép xác định người nói trong một cuộc hội thoại và truy vết theo nội dung của cuộc hội thoại đó”. Thiết bị nhận dạng có thể nghe giọng nói và so sánh với mẫu trong vòng dưới 2 giây, theo tài liệu trên.
Các nước khác cũng sử dụng công nghệ nhận dạng voiceprint cho mục tiêu tình báo. Theo các tài liệu mà Edward Snowden tiết lộ thì Cơ Quan An Ninh Quốc Gia Mỹ NSA đã sử dụng công nghệ từ lâu để theo dõi các trùm khủng bố và những đối tượng khác. Chẳng hạn để xác minh tính xác thực của các bài phát biểu của Osama bin Laden hay Ayman al Zawahiri. FBI cũng có đơn vị nghiên cứu riêng của mình. Nuance cũng đã từng bán Nuance Identifier quảng cáo là có thể giúp cảnh sát nhận dạng trong hàng triệu voiceprint trong vài giây. Cơ quan quản lý trại giam Mỹ cũng sử dụng công nghệ này để theo dõi các cuộc gọi của tù nhân…
Các công việc của iFlytek ở những vùng Tân Cương và Tây Tạng, nơi chính quyền đang tìm cách kiểm soát, tỏ ra là đáng ngờ nhất. Ở Lhasa, công ty cùng với Đại học Tây tạng thành lập phòng thí nghiệm chuyên về công nghệ và giọng nói. Công ty còn làm một app để người Tây tạng sử dụng giao tiếp có tên là Dungkar có nghĩa là “Vỏ ốc xà cừ” là một biểu tượng của Đạo Phật Tây tạng.
—
Theo ông Vương của Tổ chức Giám sát Nhân quyền, việc iFlytek sản xuất “cả các sản phẩm dân dụng lẫn các ứng dụng an ninh làm cho công ty trở nên đáng nghi ngờ”. Dữ liệu từ các dự án chính quyền có thể giúp nâng cao chất lượng các sản phẩm dân dụng và ngược lại. Tóm lại công nghệ của iFlytek hứa hẹn sẽ thay đổi cuộc sống của người dùng ở Trung quốc và đâu đó bằng cách biến giọng nói của họ vừa là phương tiện tiết kiệm thời gian vừa là biểu tượng nhận dạng không thể chạy trốn được.
Những năm gần đây, iFlytek mở rộng phát triển quốc tế, hợp tác với các phòng thí nghiệm và các trường Đại học ở Canada, New Zealand và Mỹ. Đại diện của MIT CSAIL Daniela Rus tuyên bố: “sự hợp tác sẽ tập trung giải quyết các vấn đề thách thức nhất của thế kỷ 21 là tìm cách hài hòa giữa trí tuệ con người và AI”, còn một số nhà phê bình thì hoài nghi: đây chắc chỉ là 1 vụ đổi tiền lấy danh tiếng của MIT.
Tuyên bố này được đưa ra 8 tháng sau khi Tổ chức Giám sát Nhân quyền tố các các hoạt động của iFlytek ở Tân Cương, và khi thông tin về các trại cải huấn lan truyền, nhiều nhà nghiên cứu ở MIT bắt đầu e ngại. Lundgard, một nghiên cứu sinh ở CSAIL, kể cho tôi là sau khi gia nhập CSAIL, anh ta mới biết iFlytek có tài trợ. Anh đã viết thư cho lãnh đạo giải thích lý do đạo đức để từ chối nhận tiền của công ty và nhận được trả lời là anh có lựa chọn là trả lại tiền và đi tìm tài trợ ở chỗ khác.
Hè năm ngoái, một loạt vụ việc vỡ lở khi MIT nhận tiền của tội phạm tình dục Jeff Epstein và Hoàng gia Arab Xeut. Hợp đồng hợp tác của CSAIL cũng bị đưa ra ánh sáng. Roger Levy, giám đốc Phòng thí nghiệm Tâm lý học tính toán phát biểu: “MIT cần phải rất cân nhắc khi hợp tác với các tổ chức khác. Thực chất là chúng ta đang bán danh dự của mình”.
Tháng 10, Bộ Thương mại Hoa Kỳ cho iFlytek vào danh sách các công ty bị hạn chế xuất khẩu. Để trả lời, Lưu viết trên website của công ty: “Nếu không có máu đào của các liệt sĩ đã đổ, không có nước Trung hoa hiện đại ngày nay. Nếu không có sự thịnh vượng của Trung hoa, không có chỗ đứng nào cho iFlytek. Không thế lực nào có thể ngăn cản chúng ta xây dựng một thế giới tươi đẹp bằng AI”. Ngày hôm sau, ngoại trưởng Mỹ Mike Pompeo bình luận về các sự kiện ở Tân Cương: “Những sự kiện từ trang sách của Orwell đã nhảy ra ngoài đời sống”.
…
Tôi nhớ lại tháng 4 năm ngoái, khi đi thăm quầy của iFlytek ở triển lãm ô-tô Thượng Hải. Màn hình chiếu một thanh niên đẹp giai đến bên con xe màu đỏ và cất tiếng “Chào Peter”. Màn hình trong bảng điều khiển bật sáng và hiện lên ảnh của chàng trai, còn Peter thì nói luôn miệng như nó đã đợi cả đời để gặp ông chủ. Những dòng chữ lấp lánh xuất hiện trên nền ne-on
“Hiểu bạn! Cảm thông với bạn! Hệ giao tiếp với ô tô của tương lai”.
Một nhân viên bán hàng có tên là Tinh Tiểu Linh dẫn tôi đến một quầy nhỏ để trải nghiệm. Chúng tôi đeo tai nghe và nói “Chào Flying Fish”, và màn hình bật sáng. Linh nói: “tôi muốn nghe một bài hát” và giai điệu du dương vọng vào tai tôi. Cô ấy hướng dẫn tôi nhờ Flying Fish mua máy bay đi Bắc Kinh và trả tiền. Cô còn giải thích, lần nào bạn cũng phải đánh thức Siri vì người dùng sợ nó nghe trộm, còn Flying Fish lúc nào cũng thức. Quả đúng như thế thật, tôi vừa nghe Tinh Linh vừa ghi chép lại cuộc nói chuyện. Xong việc nhìn sang màn hình của Flying Fish, đã thấy toàn bộ câu chuyện của chúng tôi được ghi lại không thiếu chữ nào!
Link bài gốc: https://www.wired.com/story/iflytek-china-ai-giant-voice-chatting-surveillance/
Nguyễn Thành Nam (tác giả)
Founder FUNiX hiện là Phó Chủ tịch HĐQT Đại học FPT. Anh Nam là một trong 13 công thần sáng lập ra Tập đoàn FPT. Với chiến công lớn trong việc khai phá và phát triển xuất khẩu phần mềm cho Tập đoàn, anh Nam từng giữ chức CEO kiêm Chủ tịch HĐQT của FPT Software, kế đến là CEO FPT.
Nhắc đến “Nam già”, người ta nghĩ ngay tới vị thủ lĩnh phong trào của FPT, đồng thời là nhân vật biểu trưng cho văn hóa STCo FPT. Suy nghĩ khác người, nhiều mơ mộng, dí dỏm một cách thông thái và đặc biệt rất sáng tạo, anh Nam là dị nhân hàng đầu ở FPT. Với gần 30 năm kinh nghiệm trong lĩnh vực phần mềm và quản lý, hiện anh Nam vẫn được tín nhiệm ở vai trò Cố vấn sáng tạo FPT.