Định lý mới lạ chứng minh rằng mạng nơ-ron tích tụ luôn có thể được đào tạo trên máy tính lượng tử, khắc phục mối đe dọa của ‘cao nguyên cằn cỗi’ trong các bài toán tối ưu hóa.
Mạng nơ-ron hợp pháp chạy trên máy tính lượng tử đã tạo ra tiếng vang đáng kể về tiềm năng phân tích dữ liệu lượng tử của chúng tốt hơn so với những máy tính cổ điển có thể. Mặc dù một vấn đề cơ bản về khả năng giải quyết được gọi là “cao nguyên cằn cỗi” đã hạn chế việc ứng dụng các mạng nơ-ron này cho các tập dữ liệu lớn, nghiên cứu mới đã vượt qua gót chân Achilles đó bằng một bằng chứng chặt chẽ đảm bảo khả năng mở rộng.
“Cách bạn xây dựng một mạng nơ-ron lượng tử có thể dẫn đến một cao nguyên cằn cỗi — hoặc không,” Marco Cerezo, đồng tác giả của bài báo có tiêu đề “Sự vắng mặt của cao nguyên cằn cỗi trong mạng nơ-ron lượng tử”, được xuất bản gần đây bởi nhóm Phòng thí nghiệm Quốc gia Los Alamos trong tạp chí Physical Review X . Cerezo là một nhà vật lý chuyên về tính toán lượng tử, máy học lượng tử và thông tin lượng tử tại Los Alamos. “Chúng tôi đã chứng minh sự vắng mặt của các cao nguyên cằn cỗi cho một loại mạng nơ-ron lượng tử đặc biệt. Công việc của chúng tôi cung cấp các đảm bảo về khả năng đào tạo cho kiến trúc này, nghĩa là người ta có thể đào tạo chung các thông số của nó. “
Là một phương pháp luận của trí tuệ nhân tạo (AI), mạng nơ-ron tích tụ lượng tử được lấy cảm hứng từ vỏ não thị giác. Do đó, chúng liên quan đến một loạt các lớp phức hợp hoặc bộ lọc, xen kẽ với các lớp tổng hợp để giảm kích thước của dữ liệu trong khi vẫn giữ các tính năng quan trọng của tập dữ liệu.
Các mạng nơ-ron này có thể được sử dụng để giải quyết một loạt vấn đề, từ nhận dạng hình ảnh đến khám phá vật liệu. Vượt qua các cao nguyên cằn cỗi là chìa khóa để khai thác toàn bộ tiềm năng của máy tính lượng tử trong các ứng dụng AI và thể hiện tính ưu việt của chúng so với máy tính cổ điển.
Cerezo cho biết, cho đến nay, các nhà nghiên cứu về máy học lượng tử đã phân tích cách giảm thiểu tác động của các cao nguyên cằn cỗi, nhưng họ thiếu cơ sở lý thuyết để tránh hoàn toàn. Nghiên cứu của Los Alamos cho thấy trên thực tế, một số mạng nơ-ron lượng tử miễn nhiễm với các cao nguyên cằn cỗi như thế nào.
Patrick Coles, một nhà vật lý lượng tử tại Los Alamos, cho biết: “Với sự đảm bảo này trong tay, các nhà nghiên cứu giờ đây sẽ có thể sàng lọc dữ liệu máy tính lượng tử về các hệ lượng tử và sử dụng thông tin đó để nghiên cứu tính chất vật liệu hoặc khám phá vật liệu mới, trong số các ứng dụng khác,” Patrick Coles, nhà vật lý lượng tử tại Los Alamos. và đồng tác giả của bài báo.
Coles nghĩ rằng sẽ có nhiều ứng dụng hơn nữa cho các thuật toán AI lượng tử khi các nhà nghiên cứu sử dụng máy tính lượng tử gần như thường xuyên hơn và tạo ra ngày càng nhiều dữ liệu — tất cả các chương trình máy học đều ngốn dữ liệu.
Tránh gradient biến mất
Cerezo nói: “Tất cả hy vọng về tốc độ lượng tử hoặc lợi thế sẽ mất đi nếu bạn có một cao nguyên cằn cỗi.”
Điểm mấu chốt của vấn đề là “độ dốc biến mất” trong bối cảnh tối ưu hóa. Cảnh quan bao gồm các ngọn đồi và thung lũng, và mục tiêu là đào tạo các tham số của mô hình để tìm ra giải pháp bằng cách khám phá địa lý của cảnh quan. Giải pháp thường nằm ở đáy của thung lũng thấp nhất, có thể nói như vậy. Nhưng trong một cảnh quan bằng phẳng, người ta không thể huấn luyện các thông số vì rất khó xác định hướng đi.
Vấn đề đó trở nên đặc biệt liên quan khi số lượng các tính năng dữ liệu tăng lên. Trên thực tế, cảnh quan trở nên phẳng theo cấp số nhân với kích thước của đối tượng địa lý. Do đó, trong sự hiện diện của một bình nguyên cằn cỗi, mạng nơ-ron lượng tử không thể được mở rộng.
Nhóm Los Alamos đã phát triển một cách tiếp cận đồ họa mới để phân tích tỷ lệ trong mạng nơ-ron lượng tử và chứng minh khả năng đào tạo của nó.
Trong hơn 40 năm, các nhà vật lý đã nghĩ rằng máy tính lượng tử sẽ tỏ ra hữu ích trong việc mô phỏng và hiểu các hệ thống lượng tử của các hạt, điều này đã làm nghẹt thở các máy tính cổ điển thông thường. Loại mạng nơ-ron tích chập lượng tử mà nghiên cứu của Los Alamos đã chứng minh là mạnh mẽ, được kỳ vọng sẽ có những ứng dụng hữu ích trong việc phân tích dữ liệu từ các mô phỏng lượng tử.
Coles nói: “Lĩnh vực máy học lượng tử vẫn còn non trẻ. “Có một câu nói nổi tiếng về tia laser, khi chúng được phát hiện lần đầu tiên, nói rằng chúng là một giải pháp để tìm kiếm một vấn đề. Bây giờ laser được sử dụng ở khắp mọi nơi. Tương tự, một số người trong chúng tôi nghi ngờ rằng dữ liệu lượng tử sẽ trở nên khả dụng cao và khi đó máy học lượng tử sẽ phát triển ”.
Coles cho biết, ví dụ, nghiên cứu đang tập trung vào vật liệu gốm làm chất siêu dẫn nhiệt độ cao, có thể cải thiện phương tiện giao thông không ma sát, chẳng hạn như tàu bay từ trường. Nhưng phân tích dữ liệu về số lượng lớn các pha của vật liệu, vốn bị ảnh hưởng bởi nhiệt độ, áp suất và tạp chất trong những vật liệu này, và phân loại các pha là một nhiệm vụ to lớn vượt quá khả năng của máy tính cổ điển.
Sử dụng mạng nơ-ron lượng tử có thể mở rộng, một máy tính lượng tử có thể sàng lọc qua một tập dữ liệu khổng lồ về các trạng thái khác nhau của một vật liệu nhất định và tương quan các trạng thái đó với các pha để xác định trạng thái tối ưu cho siêu dẫn nhiệt độ cao.
Theo: Scitechdaily.