Nếu quý vị từng bị bất ngờ khi xem một đoạn clip do AI tạo ra; nếu tài khoản ngân hàng của quý vị được hệ thống phát hiện gian lận hiện đại bảo vệ; hoặc nếu quý vị cảm thấy cuộc sống ngày càng tiện lợi và dễ chịu khi có thể ra lệnh cho điện thoại gửi tin nhắn đến bất kỳ ai trong danh bạ khi đang trên đường đi đâu đó; thì quý vị đang được hưởng lợi từ những đóng góp của các khoa học gia, nhà toán học và kỹ sư.
Nhưng có hai cái tên nổi bật với những đóng góp quan trọng, là nền tảng cho công nghệ ‘học sâu học rộng’ khiến những điều tuyệt vời trên trở thành hiện thực: nhà vật lý học tại Đại học Princeton John Hopfield và khoa học gia máy tính tại Đại học Toronto Geoffrey Hinton. Cả hai vị vừa được trao giải Nobel Vật lý vào ngày 8 tháng 10 năm 2024, vì những nghiên cứu tiên phong trong lĩnh vực mạng lưới thần kinh nhân tạo. Mặc dù được mô phỏng theo mạng lưới thần kinh sinh học, nhưng mạng lưới thần kinh nhân tạo lại được phát triển dựa trên những nguyên lý của vật lý thống kê. Vì vậy, giải Nobel này được trao trong lĩnh vực vật lý chứ không phải khoa học máy tính.
Cách một tế bào thần kinh (neuron) hoạt động
Mạng lưới thần kinh nhân tạo bắt nguồn từ các nghiên cứu về tế bào thần kinh sinh học trong bộ não người. Năm 1943, nhà sinh lý học thần kinh Warren McCulloch và nhà lô-gic học Walter Pitts đã đưa ra một mô hình đơn giản, để giải thích cách một tế bào thần kinh hoạt động, được gọi là mô hình McCulloch-Pitts. Theo mô hình này, một tế bào thần kinh kết nối với các tế bào thần kinh xung quanh và nhận tín hiệu từ chúng, sau đó kết hợp các tín hiệu này để gửi đi tín hiệu đến các tế bào thần kinh khác.
Tuy nhiên, có một điều thú vị là tế bào thần kinh có thể ‘đánh giá’ và ‘cân nhắc’ các tín hiệu từ những ‘hàng xóm’ khác nhau theo cách khác nhau. Để dễ hiểu, hãy tưởng tượng quý vị đang lưỡng lự suy nghĩ xem có nên mua một chiếc điện thoại mới ra hay không. Thường thì nhiều người sẽ đi hỏi ý kiến từ bạn bè, người thân rồi ưu tiên làm theo ý kiến, lời khuyên của đa số mọi người. Bây giờ, thí dụ tên của ba người mà quý vị hỏi thăm ý kiến là Alice, Bob và Charlie. Alice và Bob nói “nên mua,” còn Charlie thì bảo “không nên mua.” Theo cách nghĩ đơn giản nhất, quý vị sẽ quyết định mua điện thoại, vì có hai ý kiến đồng ý và chỉ một ý kiến phản đối.
Tuy nhiên, quý vị có thể tin tưởng ai đó hơn những người khác, vì họ có kiến thức sâu rộng về các thiết bị công nghệ. Do đó, quý vị có thể sẽ ‘cân nhắc’ nhiều hơn đối với những ý kiến, lời khuyên của họ. Thí dụ, nếu Charlie rất am hiểu về điện thoại, quý vị có thể sẽ ‘coi trọng’ ý kiến “không nên mua” của anh ấy nhiều hơn (gấp ba lần chẳng hạn). Kết quả là, dù có hai người khác khuyên “nên mua,” quý vị vẫn quyết định không mua vì ý kiến “không nên mua” của Charlie ‘nặng’ hơn.
Ngược lại, nếu quý vị có một người bạn mà quý vị thấy không mấy đáng tin trong vấn đề này, quý vị có thể sẽ làm ngược lại ý kiến của họ. Điều này có nghĩa là nếu người đó khuyên quý vị “mua đi,” quý vị sẽ coi như họ đang khuyên mình “đừng mua,” và ngược lại.
Rồi sau khi quý vị đã cân nhắc và đưa ra quyết định của riêng mình về việc mua hay không mua điện thoại mới, quý vị có thể sẽ được bạn bè liên lạc để hỏi ý kiến, lời khuyên. Điều này tạo ra một vòng lặp lại trong hệ thống giao tiếp thông tin.
Tương tự, đây là cách mà tế bào thần kinh nhân tạo có thể tổng hợp và gửi tín hiệu cho các tế bào thần kinh khác. Điều này lại dẫn đến một điểm khác biệt quan trọng: Trong mạng lưới có chu kỳ hỏi qua hỏi lại hay không? Thí dụ: “nếu hôm nay tôi hỏi Alice, Bob và Charlie, và ngày mai Alice hỏi tôi về ý kiến của tôi, thì liệu có một chu kỳ – từ Alice đến tôi, và từ tôi quay trở lại Alice – hay không?”
Trong mạng lưới thần kinh nhân tạo, nếu các kết nối giữa các tế bào thần kinh không có chu kỳ nào cả, tức là tín hiệu chỉ truyền đi một chiều từ tế bào thần kinh này sang tế bào thần kinh khác mà không quay lại, mạng đó được gọi là “mạng lưới thần kinh truyền tiếp” (feedforward neural network, FNN). Mạng lưới này thường được tổ chức theo từng lớp, trong đó lớp đầu tiên nhận dữ liệu đầu vào (input), lớp tiếp theo giải quyết tín hiệu từ lớp trước, và lớp cuối cùng đưa ra kết quả (output).
Ngược lại, nếu có chu kỳ trong mạng lưới thần kinh, nghĩa là tín hiệu có thể quay trở lại các tế bào thần kinh trước đó, thì mạng lưới này được gọi là “mạng lưới thần kinh hồi quy” (recurrent neural network, RNN), có cấu trúc phức tạp hơn nhiều so với mạng lưới FNN.
Mạng lưới Hopfield
Ban đầu, nguồn cảm hứng để phát triển mạng lưới thần kinh nhân tạo đến từ sinh học, nhưng rất nhanh sau đó, các lĩnh vực khác như logic, toán học và vật lý cũng bắt đầu ảnh hưởng đến quá trình phát triển này. Nhà vật lý John Hopfield đã sử dụng các ý tưởng từ vật lý để nghiên cứu một loại mạng lưới RNN đặc biệt, hiện nay được gọi là mạng lưới Hopfield. Hopfield tập trung vào việc nghiên cứu sự biến chuyển của mạng lưới này, tức là điều gì sẽ xảy ra với mạng lưới này theo thời gian?
Những sự biến chuyển này cũng tương tự như cách thông tin lan truyền trên mạng xã hội. Thí dụ, khi một thông tin (một hình ảnh “meme” chẳng hạn) được nhiều người chia sẻ, có thể khiến nhiều người cảm thấy thích thú rồi lại tiếp tục lan truyền và rất nhanh chóng trở nên nổi tiếng. Những hiện tượng lớn và rầm rộ như vậy đều bắt nguồn từ những hành động nhỏ của từng cá nhân trên mạng xã hội.
Hopfield là người tiên phong trong việc áp dụng các mô hình từ vật lý, đặc biệt là các mô hình nghiên cứu từ tính, để tìm hiểu sự biến chuyển của các mạng lưới RNN. Ông cũng chỉ ra rằng chính những sự biến chuyển này giúp các mạng lưới RNN có thể “ghi nhớ” thông tin.
Máy Boltzmann và thuật toán lan truyền ngược (backpropagation)
Vào những năm 1980, Geoffrey Hinton, nhà sinh học thần kinh tính toán Terrence Sejnowski và các cộng sự đã mở rộng các ý tưởng của John Hopfield để tạo ra một loại mô hình mới, gọi là máy Boltzmann (Boltzmann machines). Mô hình này được đặt tên theo nhà vật lý Ludwig Boltzmann thế kẻ 19, được phát triển dựa trên các nguyên lý của vật lý thống kê, trong đó các hệ thống phức tạp được mô phỏng dựa trên sự tương tác của các thành phần nhỏ.
Khác với mạng lưới Hopfield chỉ có thể lưu trữ và sửa lỗi các mẫu pattern (giống như cách chương trình kiểm tra lỗi chính tả nhận biết và sửa lỗi), máy Boltzmann có thể tạo ra các mẫu mới. Đây là ‘hạt giống’ gieo mầm cho sự phát triển vượt bậc AI tổng quát (generative AI) hiện nay.
Hinton cũng đã góp phần vào sự phát triển vượt bậc những năm 1980 với phát minh thuật toán lan truyền ngược (backpropagation). Để mạng lưới thần kinh nhân tạo có thể thực hiện các nhiệm vụ phức tạp, cần phải chọn đúng “yếu tố để cân nhắc” cho các kết nối giữa các tế bào thần kinh. Thuật toán lan truyền ngược là một công cụ quan trọng giúp lựa chọn các yếu tố này, dựa trên hiệu suất hoạt động của mạng lưới khi thử nghiệm với nguồn dữ liệu huấn luyện. Tuy nhiên, việc huấn luyện mạng lưới thần kinh nhiều lớp vẫn còn vấp phải rất nhiều khó khăn.
Trong những năm 2000, Hinton cùng các cộng sự đã khéo léo sử dụng máy Boltzmann để huấn luyện các mạng lưới nhiều lớp. Đầu tiên, họ huấn luyện cho từng lớp trước, sau đó sử dụng một thuật toán tinh chỉnh khác để điều chỉnh lại các “yếu tố cân nhắc” của toàn bộ mạng lưới. Các mạng lưới nhiều lớp này được gọi là “mạng lưới sâu” (deep networks), khởi đầu cho sự phát triển của công nghệ “học sâu học rộng” (deep learning).
Giúp “vật,” “vật” trả ơn
Giải Nobel Vật lý chính là sự công nhận rằng những ý tưởng và nghiên cứu trong lĩnh vực vật lý đã góp phần quan trọng vào sự phát triển của deep learning. Và giờ đây, deep learning đang bắt đầu “trả ơn” cho vật lý, giúp các khoa học gia mô phỏng chính xác và nhanh chóng nhiều hệ thống khác nhau, từ các phân tử, vật liệu cho đến khí hậu trên toàn bộ Địa cầu.
Việc trao Giải Nobel Vật lý cho John Hopfield và Geoffrey Hinton không chỉ là sự trân trọng đối với những đóng góp của họ, mà còn gửi gắm hy vọng của ủy ban Nobel rằng nhân loại sẽ sử dụng những thành tựu này để giúp mọi người có cuộc sống tốt hơn và xây dựng một thế giới bền vững hơn.
Cung Mi biên dịch
Nguồn: “Nobel Prize in physics spotlights key breakthroughs in AI revolution − making machines that learn” được đăng trên trang TheConversation.com.
Gửi ý kiến của bạn