Khi web trên toàn thế giới đã trưởng thành trong hai thập kỷ qua, hai người khổng lồ của ngành đã nổi lên như những lực lượng thống trị trực tuyến. Những câu chuyện về nguồn gốc của Google và Facebook đã được nhiều người biết đến. Công cụ tìm kiếm đầu tiên của Google bắt đầu vào năm 1996 như một dự án nghiên cứu tại Stanford. Mạng xã hội Facebook ra đời năm 2004 như một dự án phụ của Mark Zuckerberg tại Harvard.
Khi hai công ty này đã niêm yết trên thị trường chứng khoán và tiếp cận người dùng ở mọi quốc gia và mọi châu lục, họ buộc phải trở thành nhiều thứ hơn là một công cụ internet tiện dụng. Giờ đây, họ là những tập đoàn chính thức tương tác với nhiều dữ liệu hơn bất kỳ ai từng tưởng tượng.
Nhưng chính xác thì Facebook và Google làm gì với hàng petabyte thông tin chảy qua các máy chủ của họ hàng ngày? Có vô số câu trả lời cho câu hỏi đó và Thần Khúc sẽ giúp bạn khám phá tất cả chúng trong bài viết này.

Quảng cáo
Như đã đề cập, Google và Facebook đều là những công ty giao dịch công khai trên thị trường chứng khoán và do đó được kỳ vọng sẽ tăng trưởng và mang lại lợi nhuận cho các nhà đầu tư và cổ đông. Giống như nhiều công ty kỹ thuật số phục vụ người tiêu dùng internet nói chung, họ dựa vào quảng cáo làm hình thức thu nhập chính.
Theo nguyên tắc chung, khi bạn đăng ký một tài khoản mới trên mạng xã hội hoặc trang web khác và không phải trả phí hoặc đăng ký, thì bạn sẽ thấy rất nhiều quảng cáo. Về bản chất, hành vi của bạn trên trang web và dữ liệu được thu thập là tài sản có giá trị đối với công ty.
Quảng cáo trực tuyến đã mang tiếng xấu, nhưng khái niệm đằng sau nó không phải là xấu về bản chất. Đối với một công cụ tìm kiếm như Google, ý tưởng là hiển thị cho bạn các quảng cáo bên cạnh kết quả tìm kiếm của bạn với hy vọng thu hút bạn đến một sản phẩm liên quan đến truy vấn của bạn. Điều này cũng đúng với các mạng xã hội như Facebook: chúng nhằm mục đích hiển thị các quảng cáo có liên quan dựa trên lịch sử sở thích và lượt thích của bạn.
Các công ty bên ngoài đấu thầu bất động sản trên màn hình để giành quyền hiển thị quảng cáo của riêng họ, thường dựa trên các từ khóa. Các mạng xã hội có thể tính phí nhiều tiền hơn cho các nhà quảng cáo khi sử dụng một hệ thống được nhắm mục tiêu, thay vì chỉ hiển thị một bộ quảng cáo chung cho tất cả người dùng. Đây là lý do tại sao các nhà quảng cáo thường chi nhiều tiền hơn cho các chiến dịch trực tuyến so với thông thường trên báo chí hoặc các định dạng in ấn khác.
Nếu không theo dõi hành vi và hoạt động của bạn trên các trang web và ứng dụng của họ, Google và Facebook sẽ không thể phân phát các quảng cáo có liên quan trong hệ thống của họ. Theo chính sách bảo mật của họ, cả hai công ty đều nói rằng dữ liệu người dùng không bao giờ được chia sẻ trực tiếp với bên thứ ba. Thay vào đó, hệ thống được quản lý hoàn toàn thông qua thuật toán nội bộ để đối sánh nhà quảng cáo với người dùng có liên quan.
Nếu bạn muốn ẩn danh hơn khi sử dụng Google và Facebook trong khi vẫn duy trì một tài khoản trên mỗi nền tảng, bạn nên xem xét các máy khách mạng riêng ảo (VPN). VPN tạo một đường hầm an toàn từ mạng gia đình hoặc văn phòng của bạn đến mạng internet mở, với tất cả dữ liệu được gửi qua một kênh được mã hóa.
Một VPN tuyệt vời không chỉ giúp bảo vệ bạn khỏi tin tặc và tội phạm mạng mà còn khiến bạn khó bị theo dõi trực tuyến hơn. Máy khách VPN cấp một địa chỉ IP mới mỗi khi bạn khởi chạy kết nối. Google và Facebook vẫn có thể theo dõi hoạt động của bạn khi đăng nhập, nhưng họ sẽ gặp khó khăn hơn trong việc xác định vị trí địa lý của bạn. Hãy xem bài đánh giá của Thần Khúc về NordVPN hoặc Surfshark để xem nhanh mức độ mạnh mẽ của các dịch vụ này.
Trải nghiệm người dùng và phát triển sản phẩm
Cả Google và Facebook đều nhằm mục đích cung cấp trải nghiệm được cá nhân hóa cho từng người dùng. Đó là lý do tại sao khi bạn chạy một tìm kiếm mới trên Google khi đã đăng nhập, trang web sẽ ghi nhớ lịch sử tìm kiếm của bạn và những trang web bạn đã nhấp vào trong quá khứ. Điều tương tự cũng xảy ra với Facebook, vì dòng thời gian của người dùng chứa đầy nội dung mà họ đã thích hoặc theo dõi trước đó.
Tất cả các trang web đều dựa trên một mạng cơ sở dữ liệu phía sau để lưu trữ thông tin quan trọng về người dùng truy cập vào phía trước. Các công ty như Google và Facebook dựa vào dữ liệu này để mang lại trải nghiệm người dùng tích cực được tùy chỉnh cho từng người dùng.
Cho rằng các trang web và ứng dụng của họ có hàng tỷ người dùng trên toàn thế giới, không có cách nào khả thi để Google hoặc Facebook giữ liên lạc với từng người và khảo sát ý kiến của họ. Thay vào đó, các công ty thực sự thu thập và phân tích dữ liệu người dùng mà họ thu thập để hiểu rõ hơn về những gì đang hoạt động và những gì không hoạt động trong các sản phẩm của họ. Đừng nhầm lẫn giữa khảo sát và bảng câu hỏi.
Ví dụ: khi theo dõi việc sử dụng trong công cụ Gmail, Google có thể xác định rằng một tỷ lệ lớn người dùng đã quên đính kèm tài liệu vào email gửi đi và sau đó phải gửi thư tiếp theo. Để trợ giúp, Google đã triển khai một tính năng Gmail mới có thể quét các thư gửi đi để đề cập đến tệp đính kèm và sau đó nhắc người dùng gửi kèm tệp trước khi nhấp vào nút gửi.
Facebook cũng tận dụng dữ liệu người dùng để giúp định hướng các quyết định về sản phẩm. Khi công ty phát triển, họ phát hiện ra rằng người dùng đang dựa vào tính năng hộp thư của ứng dụng di động giống như một công cụ nhắn tin văn bản. Để cung cấp trải nghiệm người dùng tốt hơn, Facebook đã quyết định chuyển chức năng này sang một ứng dụng chuyên dụng có tên là Messenger.
Tích hợp tài khoản
Khi Google và Facebook phát triển, họ đã mở rộng vượt xa mục đích sản phẩm ban đầu của họ. Google không chỉ là một công cụ tìm kiếm, với các công cụ dành riêng cho email, truyền phát video, lưu trữ đám mây và lập bản đồ. Điều này cũng đúng với Facebook, vì nó đã vượt ra khỏi phạm vi chỉ là một mạng xã hội và hiện sở hữu các ứng dụng như Instagram đồng thời phát triển phần cứng của riêng mình.
Người dùng Internet đã mong đợi web phải nhanh và dễ sử dụng. Điều đó có nghĩa là họ muốn giảm số lượng tài khoản và mật khẩu mà họ phải ghi nhớ hàng ngày. Google và Facebook đều sử dụng hệ thống dữ liệu của họ để làm cho internet thuận tiện hơn cho người dùng của họ.
Khi bạn đã đăng nhập trên máy tính hoặc thiết bị di động vào Google hoặc Facebook, thông tin đăng nhập của bạn sẽ tự động hoạt động trên bất kỳ sản phẩm nào trong bộ công cụ của họ. Ngoài ra, khi bạn duyệt web và tình cờ gặp các trang web hoặc ứng dụng khác, bạn sẽ thường thấy rằng bạn có thể đăng nhập vào chúng bằng tài khoản Google hoặc Facebook thay vì tạo thông tin đăng nhập hoàn toàn mới. Tuy nhiên, một số người dùng sẽ thích sử dụng công cụ quản lý mật khẩu an toàn hơn để xử lý tất cả thông tin đăng nhập của họ.
Khi con bạn đủ lớn để đăng ký Google hoặc Facebook, thường là ở độ tuổi 13, thì biện pháp bảo vệ trực tuyến dành cho con bạn có thể kiểm soát nơi chúng được phép sử dụng những thông tin đăng nhập đó. Nếu họ được phép phát tán tài khoản của mình đến những nơi khác trên web, điều đó có thể khiến họ dễ bị tấn công hoặc bắt nạt hơn.
Yêu cầu của chính phủ
Khi bạn đăng ký một tài khoản với Google hoặc Facebook, bạn đang chấp nhận một mức độ rủi ro nhất định. Tên người dùng của bạn được gắn với mọi hành động và nhấp chuột mà bạn thực hiện trên các trang web này và bạn nên nhớ rằng các công ty sở hữu hệ thống phụ trợ có thể truy cập thông tin này bất kỳ lúc nào.
Trường hợp mối quan tâm này thực sự phát huy tác dụng là với các chính phủ quốc gia. Nhiều quốc gia phát triển, bao gồm Hoa Kỳ, Úc và Canada, có luật pháp quy định thời điểm cơ quan chính phủ có thể thu thập dữ liệu từ một công ty internet. Trong hầu hết các trường hợp, yêu cầu phải xuất phát từ vấn đề an ninh quốc gia.
Ví dụ: nếu chính phủ tin rằng một nhóm khủng bố bị nghi ngờ đã được liên lạc qua kênh do Google hoặc Facebook sở hữu, họ có thể đưa ra yêu cầu công ty chuyển hồ sơ từ một người dùng, khung thời gian hoặc dải địa chỉ IP cụ thể. Công ty không cần thông báo cho bạn nếu thông tin của bạn được bao gồm trong những gì họ thu thập.
Nhưng đó có phải là những trường hợp duy nhất mà chính phủ có thể truy cập vào các trang web lớn như Google hay Facebook? Dựa trên những tiết lộ mà Edward Snowden đã phát hiện vào năm 2013, rất có khả năng các chính phủ lớn và các tổ chức quốc tế có quyền truy cập cửa hậu vào các hệ thống nhằm mục đích giám sát hoạt động đáng ngờ.
Thực tế là các loại cửa hậu này tồn tại là điều đáng lo ngại, bởi vì điều đó có nghĩa là có nhiều khả năng tin tặc có thể xâm nhập vào các hệ thống đằng sau chúng. Đó là một trong những lý do tại sao quyền riêng tư trực tuyến trở thành một chủ đề nóng trong những năm gần đây.
Khoa học dữ liệu
Khái niệm về dữ liệu lớn đã xuất hiện được hơn một thập kỷ. Lập luận cơ bản của nó là các công ty nên lưu trữ càng nhiều thông tin càng tốt bởi vì với nhiều dữ liệu hơn sẽ giúp phân tích tốt hơn và đưa ra quyết định sáng suốt hơn. Không chỉ vậy, dữ liệu lớn đang thực sự chứng minh khả năng thúc đẩy các công nghệ mới phát triển.
Google và Facebook đều tham gia rất nhiều vào phong trào học máy, nơi các công ty đang cố gắng dạy phần mềm xác định các mẫu và xu hướng trên các tập dữ liệu lớn. Mục tiêu là phát triển các thuật toán cải tiến theo thời gian và tiếp tục phát triển, cuối cùng hướng tới một tương lai nơi thực tế nhân tạo khả thi.
Ví dụ: danh sách các kết quả tìm kiếm được đề xuất của Google được xây dựng trên một công cụ dữ liệu lớn. Các thuật toán máy học của họ liên tục phân tích các truy vấn mới được chạy mỗi giây và kết quả đầu ra là sự hiểu biết toàn diện về những gì đang là xu hướng trên toàn thế giới và hành vi của xã hội đang thay đổi như thế nào.
Đối với Facebook, máy học đã phát huy tác dụng cùng với những tiến bộ của họ trong công nghệ nhận dạng khuôn mặt. Kể từ những ngày đầu của mạng xã hội, người dùng đã yêu thích chức năng lưu trữ và chia sẻ ảnh. Và mỗi khi người dùng tải lên một ảnh hoặc album mới, họ luôn được nhắc gắn thẻ từng người bằng tên của họ.
Nhờ các thuật toán máy học, hệ thống của Facebook hiện có thể xác định các khuôn mặt cụ thể trong các bức ảnh mới mà bạn không cần phải cung cấp bất kỳ thông tin nào. Các tính năng như thế này không phải lúc nào cũng chính xác hoặc chính xác, nhưng chúng thể hiện sự tiến bộ ấn tượng về khả năng của công nghệ trong tương lai.
Tóm lại
Cách hai gã khổng lồ công nghệ gia dụng này sử dụng dữ liệu của bạn có thể khiến bạn kinh ngạc và đồng thời lo lắng. Thực tế là, mỗi khi bạn truy cập trực tuyến, dữ liệu của bạn sẽ được thu thập, lưu và phân tích theo nhiều cách mà bạn không muốn biết.
Tuy nhiên, vị thần đã ra khỏi chai. Trừ khi bạn quyết định chuyển sang chế độ ngoại tuyến hoàn toàn hoặc công nghệ chuỗi khối mới lạ đó cuối cùng sẽ cho phép Thần Khúc lấy lại quyền kiểm soát dữ liệu của mình, nếu không thì Facebook và Google sẽ tiếp tục biến thông tin của Thần Khúc thành sản phẩm trung tâm mang lại lợi nhuận cho họ.

Tốt nghiệp Đại Học Bách Khoa Đà Nẵng chuyên ngành điện nhưng lại đam mê máy tính. Thần Khúc là nơi tôi thể hiện đam mê thông qua những chia sẽ hiểu biết cá nhân từ công nghệ, phần mềm cho tới các game giải trí. Mong rằng những chia sẽ của tôi sẽ giúp độc giả giải quyết vấn đề một cách nhanh chóng.