Phát hiện những video giả mạo

English: The scientist who spots fake videos

Hany Farid thảo luận cách để phát hiện các bức ảnh giả mạo và thủ đoạn ngày càng tinh vi tạo ra bởi những kẻ làm giả.

Eli Burakian/Dartmouth College

Hany Farid.

Hany Farid, tiến sĩ máy tính tại trường Đại học Dartmouth ở Hanover, New Hampshire, chuyên phát hiện những bức ảnh và video giả. Farid, cung cấp dịch vụ cho những khách hàng đa dạng như các trường đại học, các tổ chức truyền thông và cả tòa án, nói rằng việc các bức ảnh giả mạo đã trở nên quá thường xuyên và ngày càng tinh vi hơn. Farid có cuộc trao đổi với Nature về cuộc chạy đua để đi trước những kẻ làm giả

Một kỹ thuật đơn giản nhưng cực kỳ hữu dụng là tìm kiếm hình ảnh ngược. Bạn tải hình ảnh lên một trang web như Google tìm kiếm hình ảnh hoặc TinEye, và chúng chỉ ra cho bạn tất cả những phiên bản của bức ảnh. Một dự án của trường Đại học Columbia, Thành phố New York, đang đưa điều này lên một tầm mới và bắt đầu tìm kiếm những phần của các bức ảnh đã được tái sử dụng từ những bức ảnh khác.
“Tôi đã từng thấy công nghệ này đủ tốt nhưng giờ tôi rất lo lắng”
Thông thường, chúng ta nghĩ về việc các hoa văn, hình học, màu sắc hoặc cấu trúc sẽ bị phá vỡ khi ai đó làm giả một bức ảnh. Ví dụ như khi mọi người thêm một vật vào một cảnh, chúng ta biết rằng nơi họ đặt cái bóng thường sai. Một video lan truyền có tên là Golden Eagle Snatches Kid (Đại bàng vàng cắp trẻ con) từ năm 2012 là một trong những ví dụ ưa thích của tôi. Chỉ với 15 phút phân tích để chỉ ra rằng cái bóng không đồng nhất: con đại bàng và đứa trẻ là do máy tính tạo nên.

SẼ RA SAO NẾU NHỮNG BỨC ẢNH GIẢ CHỈ CHỈNH SỬA MỘT CHÚT?

Có một số phân tích chúng ta có thể làm được. Trong một bức ảnh màu, mỗi điểm ảnh cần ba giá trị – tương ứng với số lượng màu đỏ, xanh lá cây, xanh dương ở tại điểm đó. Nhưng ở hầu hết các máy ảnh, mỗi điểm ảnh chỉ ghi một màu và máy ảnh lấp đầy các khoảng trống bằng việc lấy giá trị trung bình của các điểm ảnh xung quanh nó. Điều đó có nghĩa rằng, đối với bất kỳ màu sắc nhất định trong một bức ảnh, mỗi điểm ảnh thiếu có mối tương quan nhất định với những cái xung quanh nó, điều đó sẽ bị phá hủy nếu chúng ta thêm hoặc vẽ màu thứ gì đó và chúng ta có thể phát hiện điều đó.

Một kỹ thuật khác đó là nén JPEG. Gần như mọi bức ảnh đều được lưu trữ ở dạng file JPEG, điều này sẽ làm mất đi vài thông tin lưu trữ. Có một sự khác nhau khổng lồ về cách mà mỗi máy ảnh làm điều đó. Nếu một bức ảnh JPEG được giải nén- được mở trong một ứng dụng photoshop- và sau đó được đặt lại với nhau, nó luôn được đóng gói lại khác một chút và chúng ta có thể phát hiện điều đó. Tôi ước rằng bạn có thể tải lên bất kỳ bức ảnh nào và chúng tôi có thể nói cho bạn nó có phải thật hay không, nhưng điều đó là một quá trình rất khó khăn và đòi hỏi chuyên môn để hiểu rõ nhiều thành phần khác nhau.

Ai đang sử dụng dịch vụ pháp y kỹ thuật số của anh?

Tôi phân tích cho các tổ chức liên quan đến báo chí như Reuters, New York Times. Chỉ có số ít các giáo sư đại học trên thế giới chuyên về vấn đề này nên nó không quy mô cho lắm – điều đó có nghĩa là bạn chỉ có thể thực hiện việc phân tích của những hình ảnh có chất lượng cao. Nhưng đang có những nỗ lực để tăng quy mô lên. Năm ngoái, Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến của Hoa Kỳ (DARPA) đã tham gia vào cuộc chơi này với một dự án lớn trong đó có tôi tham gia. Trong 5 năm tới, họ sẽ cố gắng tạo ra một hệ thống sẽ cho phép bạn phân tích hàng trăm ngàn bức ảnh một ngày. Nó là một chương trình đầy tham vọng.

Tôi cũng làm rất nhiều công việc ở tòa án. Ví dụ, ở Hoa kỳ, khiêu dâm trẻ em là bất hợp pháp nhưng những nội dung khiêu dâm trẻ em do máy tính tạo nên được tính là “quyền tự do ngôn luận” theo điều khoản đầu tiên của Hiến pháp. Nếu ai đó bị bắt giữ họ có thể nói rằng hình ảnh vi phạm đó không phải là thật và tôi có thể phải chứng minh rằng đó là thật. Tôi cũng nhận được khá nhiều email từ nhiều người về những bức ảnh lừa bịp – gần như hằng ngày.

ANH CÓ ÁP DỤNG CÁC KỸ THUẬT CỦA ANH VÀO CÁC BÀI BÁO KHOA HỌC KHÔNG?

Tôi đã làm việc với rất nhiều trường hợp có hành vi khoa học sai trái. Tôi được thuê bởi các trường đại học tiến hành kiểm tra nội bộ. Gần đây, khi tôi đến thăm Văn phòng nghiên cứu Liêm chính Hoa kỳ, họ đã hỏi tôi “ Làm cách nào để chúng ta có được các công cụ tự động?” Thực tế là chúng ta vẫn chưa đến được đó. Nhưng việc tạo ra thứ gì đó bằng việc sử dụng một vài công cụ, như là phát hiện bản sao, để xem có những phần nào của bức ảnh đã được sao chép và dán từ bất cứ đâu, có khả năng như một quá trình bán tự động nhìn vào trong hàng chục, không phải, hàng triệu bức ảnh một ngày. Đó là thứ mà tôi và các đồng nghiệp của tôi đã nghĩ đến, và nó nhỏ nhưng không phải phần đáng kể của chương trình DARPA.

PHÁT HIỆN CÁC VIDEO GIẢ THÌ SAO?

Những người nghiên cứu nay đã có thể ghép các cảnh quay với nhau để tạo ra những video của những người nổi tiếng nói những điều mà họ không bao giờ nói – lấy ví dụ, từ video của Tổng thống Obama và họ có thể tạo ra những tấm ảnh giả hoặc những video ngắn sử dụng kỹ thuật máy học Máy học là khả năng tự học tập dựa trên dữ liệu đưa vào mà không cần lập trình cụ thể của máy móc), đặc biệt, mạng chống đối tạo sinh (generative adversarial networks -GANs) đang học cách tạo ra nội dung giả. Những cái hố mạng này tạo ra những nội dung giả chống lại mạng lưới “phân loại” đang cố gắng để phân biệt giữa nội dung giả và thật, để mạng giả cải tiến nhanh chóng.

Tôi đã từng thấy công nghệ đủ tốt nhưng giờ tôi lại thấy lo lắng như bây giờ. Trong vòng 5 đến 10 năm, nó sẽ trở nên thực sự tốt. Tại một thời điểm nào đó, chúng ta sẽ đến giai đoạn có thể tạo ra các video thực tế, với âm thanh, của một nhà lãnh đạo thế giới, và điều đó sẽ trở nên rất hỗn loạn. Tôi sẽ nói rằng lĩnh vực pháp y kỹ thuật số giờ đang ở phía sau trong việc phát hiện video giả.

LÀM THẾ NÀO ĐỂ PHÁT HIỆN RA VIDEO GIẢ?

Nén JPEG có một cấu trúc giống nhau trong đoạn phim, sẽ hơi khó để phát hiện do video dùng một phiên bản tinh vi hơn. Một cách tiếp cận khác là dùng máy học để tìm ra. Nhưng chúng ta làm một bước tiếp cận tương tự như cách chúng ta làm với các bức ảnh- dựa trên việc quan sát nội dung máy tính tạo ra thiếu sự không hoàn hảo, điều đó thể hiện trên những đoạn phim được ghi lại. Nó được tạo ra trong một thế giới gần như hoàn hảo. Vì vậy, một trong những thứ chúng ta nhìn vào là ta không thấy mô hình hình học và thống kê mà ta mong mong là thấy trong thế giới vật lý?

Một kỹ thuật khác dựa trên một vài các tác phẩm tuyệt vời của William Freeman và đồng nghiệp ở Viện công nghệ Massachusetts, Cambridge; người đã chỉ ra cách phóng to các thay đổi thật nhỏ trong video của một người, bạn có thể thấy những thay đổi khôn khéo trong màu sắc trên khuôn mặt của họ tương ứng với nhịp tim của họ. Chúng tôi đã chỉ ra rằng bạn có thể sử dụng kỹ thuật này để phân biệt người thật từ những người do máy tính tạo nên.

LIỆU CÁC THUẬT TOÁN MÁY HỌC CÓ THỂ HỌC ĐỂ CÓ ĐƯỢC NHỮNG ĐẶC TÍNH NÀY?

Có thể về lý thuyết nhưng trong thực tế, những thuật toán này có giới hạn thời gian và dữ liệu đào tạo, có rất ít quyền kiểm soát đối với các tính năng mà một mạng nơ-ron chọn để phân biệt giữa những video thật và giả. Một mạng chống đối tạo sinh( GAN) chỉ cố gắng đánh lừa những bộ phân loại mà nó đào tạo. Không có một đảm bảo nào rằng máy sẽ học được tất cả những khía cạnh của những thứ tạo nên ảnh hoặc video giả hoặc thật, hoặc nó sẽ đánh lừa bộ phân loại khác.

Đối thủ của tôi sẽ phải bổ sung tất cả những kỹ thuật pháp y mà tôi sử dụng, vì vậy mạng nơ-ron (neural network) có thể học để phá vỡ những phân tích này: ví dụ, bằng cách thêm các mạch đập vào. Theo cách đó, tôi đã khiến công việc của kẻ giả mạo trở nên khó khăn hơn.

Đây là một cuộc chạy đua vũ trang. Khi chúng ta phát triển nhanh hơn, con người tạo ra những công nghệ ngày càng tinh vi hơn để tăng tính âm thanh, hình ảnh và video. Cách mà để kết thúc cuộc chiến này là ta loại bỏ khả năng tạo ra một bản làm giả hoàn hảo khỏi tay kẻ nghiệp dư. Làm cho việc làm giả ngày càng khó hơn, vì vậy nó tốn thời gian và kỹ thuật làm giả hơn, và nguy cơ bị phát hiện cũng cao hơn.

One thought on “Phát hiện những video giả mạo

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất /  Thay đổi )

Google photo

Bạn đang bình luận bằng tài khoản Google Đăng xuất /  Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất /  Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất /  Thay đổi )

Connecting to %s