Học máy (ML) đã trở thành một chủ đề nóng trong vài năm gần đây, nhưng điều bạn có thể không nhận ra là khái niệm học máy đã có từ hàng chục năm nay. Thiết kế của các hệ thống máy học được sử dụng cho đến ngày nay dựa trên mô hình bộ não con người được Donald Hebb mô tả vào năm 1949 trong cuốn sách “Tổ chức Hành vi” của ông.
Hebb lưu ý rằng khi các tế bào trong não kích hoạt theo một kiểu lặp đi lặp lại, các nút khớp thần kinh được hình thành hoặc phóng to nếu chúng đã tồn tại. Nguyên tắc tương tự được áp dụng cho các nút trong mạng lưới thần kinh kỹ thuật số. Các nút phát triển các mối quan hệ phát triển mạnh hơn nếu chúng được kích hoạt đồng thời và yếu đi nếu chúng kích hoạt riêng lẻ. Học tăng cường là một hình thức học máy dựa trên khái niệm này, nhưng chúng ta đừng vượt lên chính mình.
“Machine Learning là nghiên cứu về các thuật toán máy tính tự động cải thiện thông qua kinh nghiệm.” — Tom Mitchell
Lập trình viên IBM và người tiên phong về trí tuệ nhân tạo Arthur Samuel đã đặt ra thuật ngữ “máy học” vào năm 1952. Samuel đã viết một chương trình chơi cờ caro “đã học” và càng chơi càng chơi càng hay. Anh ấy đã sử dụng một kỹ thuật gọi là “cắt tỉa alpha-beta”, sẽ tính điểm trên bàn cờ dựa trên vị trí của các quân cờ và cơ hội chiến thắng của mỗi bên. Mô hình này đã phát triển thành thuật toán Minimax vẫn được dạy cho đến ngày nay.
Trong suốt nhiều thập kỷ, những người tiên phong khác đã kết hợp, điều chỉnh và áp dụng các mô hình Hebb và Samuel (và những mô hình tiếp theo) cho các ứng dụng khác nhau. Ví dụ, vào năm 1957, Frank Rosenblatt đã chế tạo Mark 1 perceptron, một trong những máy nhận dạng hình ảnh đầu tiên và là máy tính thần kinh thành công đầu tiên.
Nhiều ứng dụng như nhận dạng giọng nói và khuôn mặt, phân tích dữ liệu, xử lý ngôn ngữ tự nhiên và thậm chí cả cảnh báo lừa đảo trong email của chúng tôi đều dựa trên công việc của những nhà đổi mới này.
Một thập kỷ sau, vào năm 1967, Marcello Pelillo đã phát triển “quy tắc láng giềng gần nhất” để nhận dạng mẫu. Thuật toán hàng xóm gần nhất là ông tổ của các ứng dụng bản đồ GPS ngày nay. Những người khác tiếp tục xây dựng trên những nền tảng này để tạo ra các mạng nơ-ron perceptron nhiều lớp vào những năm 1960 và lan truyền ngược vào những năm 1970, mà các nhà nghiên cứu sử dụng để huấn luyện các mạng nơ-ron sâu.
Tất cả các công việc trước đây đã hình thành nên nền tảng của nghiên cứu đang diễn ra ngày nay. Nhiều ứng dụng như nhận dạng giọng nói và khuôn mặt, phân tích dữ liệu, xử lý ngôn ngữ tự nhiên (tổng hợp giọng nói) và thậm chí cả cảnh báo lừa đảo trong email của chúng tôi đều dựa trên công việc của những nhà đổi mới này. Tự động hóa ngày nay trong hầu hết mọi lĩnh vực của nền kinh tế đã đưa máy học lên hàng đầu, nhưng nó luôn hoạt động ở chế độ nền.
Giới hàn lâm vẫn chưa giải quyết được một định nghĩa tiêu chuẩn cho Machine Learning. Phạm vi của ML rất rộng và không dễ dàng rút gọn trong một câu, mặc dù một số người đã thử…
Định nghĩa của MIT viết, “Các thuật toán học máy sử dụng số liệu thống kê để tìm các mẫu trong lượng dữ liệu khổng lồ, [bao gồm] số, từ, hình ảnh, lần nhấp, v.v. Nếu nó có thể được lưu trữ bằng kỹ thuật số, nó có thể được đưa vào máy- học thuật toán.”
“Học máy là khoa học làm cho máy tính hoạt động mà không được lập trình rõ ràng,” là cách khóa học Máy học của Stanford mô tả về nó.
Trong khi đó, Carnegie Mellon nói, “Lĩnh vực Học máy tìm cách trả lời câu hỏi, ‘Làm thế nào chúng ta có thể xây dựng các hệ thống máy tính tự động cải thiện theo kinh nghiệm và đâu là quy luật cơ bản chi phối tất cả các quá trình học tập?'”
Đối với các mục đích thực tế, chúng ta có thể ném những nguyên liệu đó vào nồi của mình và đun sôi thành:
Học máy liên quan đến việc đào tạo một máy tính với một số lượng lớn các ví dụ để tự động đưa ra các quyết định hợp lý dựa trên một lượng dữ liệu đầu vào hạn chế và để cải thiện quy trình đó khi sử dụng.
Chúng tôi nghe nhiều thuật ngữ khác được đưa ra trong các cuộc thảo luận về học máy, đặc biệt là trí tuệ nhân tạo và học sâu. Mặc dù các lĩnh vực này có liên quan với nhau nhưng chúng không giống nhau. Hiểu mối quan hệ giữa các công nghệ này là chìa khóa để tìm hiểu chính xác máy học là gì.
Trí tuệ nhân tạo, học máy và học sâu là ba loại khoa học máy tính lồng vào nhau. Điều đó có nghĩa là, học máy là một tập hợp con của AI và học sâu là một tập hợp con của ML (xem sơ đồ).
Trí tuệ nhân tạo nói chung là một tập hợp các hướng dẫn cho máy tính biết cách hành động hoặc hiển thị hành vi giống con người. Cách nó phản ứng với đầu vào được mã hóa cứng, tức là “Nếu điều này xảy ra, hãy làm điều đó.” Nguyên tắc chung là nếu AI được cho biết rõ ràng những quyết định cần đưa ra, thì chương trình nằm ngoài lĩnh vực học máy.

Học máy là một tập hợp con của AI có thể hoạt động tự chủ. Không giống như AI nói chung, thuật toán ML không cần phải cho biết cách diễn giải thông tin. Mạng thần kinh nhân tạo (ANN) đơn giản nhất bao gồm một lớp thuật toán máy học (xem bên dưới).
Giống như một đứa trẻ, nó cần được đào tạo bằng cách sử dụng đầu vào hoặc bộ dữ liệu được gắn thẻ hoặc phân loại. Nói cách khác, khi dữ liệu được giới thiệu, nó phải được cho biết nó là gì, tức là đây là con mèo và đây là con chó. Được trang bị thông tin đó, ANN sau đó có thể hoàn thành nhiệm vụ của mình mà không cần hướng dẫn rõ ràng để có được kết quả hoặc đầu ra.

Học sâu là một tập hợp con của AI và học máy. Các cấu trúc này bao gồm nhiều lớp thuật toán ML. Do đó, chúng thường được gọi là “mạng lưới thần kinh sâu” (DNN). Dữ liệu đầu vào được chuyển qua các lớp, với mỗi lớp được thêm từ hạn định hoặc thẻ. Vì vậy, học sâu không yêu cầu dữ liệu được phân loại trước để diễn giải.
Chúng ta sẽ khám phá thêm sự khác biệt giữa ML và DL trong giây lát.
Cho dù chúng ta đang đề cập đến học máy một lớp hay mạng lưới thần kinh sâu, thì cả hai đều cần được đào tạo. Mặc dù một số chương trình ML đơn giản, còn được gọi là người học, có thể được đào tạo với lượng thông tin mẫu tương đối nhỏ, nhưng hầu hết đều yêu cầu lượng dữ liệu đầu vào dồi dào để hoạt động chính xác.
Bất kể nhu cầu ban đầu của hệ thống ML được đào tạo là gì, hệ thống được cung cấp càng nhiều ví dụ thì hệ thống đó càng hoạt động tốt hơn. Những người học sâu thường cần nhiều thông tin đầu vào hơn so với ML một lớp vì họ không biết gì về cách phân loại dữ liệu. Không có gì lạ khi các hệ thống sử dụng bộ dữ liệu chứa hàng triệu hoặc hàng trăm triệu ví dụ để đào tạo.
Cách các chương trình ML sử dụng khối lượng dữ liệu khổng lồ này tùy thuộc vào loại hình học tập nào được sử dụng. Hiện tại, có ba mô hình học tập—có giám sát, không có giám sát và tăng cường. Việc sử dụng cái nào phụ thuộc chủ yếu vào những gì cần phải hoàn thành.
Học có giám sát không giống như tên gọi của nó. Người vận hành không ngồi xem người học khi nó hoạt động và điều chỉnh lỗi. Học có giám sát chỉ có nghĩa là dữ liệu đầu vào phải được gắn nhãn hoặc phân loại để các thuật toán thực hiện công việc của chúng. Hệ thống phải biết dữ liệu đầu vào là gì để biết phải làm gì với nó.

Học có giám sát là phương pháp đào tạo ML phổ biến nhất và được sử dụng trong nhiều ứng dụng quen thuộc.
Ví dụ: nhiều dịch vụ như PlayStation Network, Netflix, Spotify và các dịch vụ khác sử dụng nó để tự động tạo danh sách được sắp xếp dựa trên tùy chọn của người dùng. Mỗi khi người dùng mua trò chơi, xem phim hoặc phát một bài hát, thuật toán ML sẽ ghi lại và phân tích dữ liệu đó cũng như các thẻ của nó, sau đó tìm kiếm nội dung tương tự. Dịch vụ được sử dụng càng nhiều, hệ thống càng học hỏi và dự đoán tốt hơn những gì người dùng muốn.
Học tập không giám sát không yêu cầu nhãn. Trong trường hợp này, người học tìm kiếm các mẫu và tạo các danh mục riêng. Ví dụ: nếu được cung cấp hình ảnh của một con chó, nó không thể phân loại nó như vậy vì không có dữ liệu để cho biết nó là gì. Thay vào đó, nó xem xét những thứ như hình dạng hoặc màu sắc và tạo ra một phân loại thô sơ. Khi được cung cấp thêm dữ liệu, nó có thể tinh chỉnh hồ sơ về chó của mình, tạo các thẻ bổ sung để phân biệt chúng với các đối tượng hoặc động vật khác.
Các hệ thống ML một lớp không hoạt động hiệu quả với đầu vào không được gắn nhãn. Một phần của điều này là do nó yêu cầu các mạng thần kinh sâu để hiểu được thông tin. Mạng nhiều lớp phù hợp hơn với kiểu xử lý dữ liệu này vì mỗi lớp thực hiện một chức năng cụ thể với đầu vào trước khi chuyển nó sang lớp khác cùng với kết quả của nó. Vì ANN phổ biến hơn rất nhiều so với DNN, nên việc học không giám sát được coi là một hình thức đào tạo hiếm gặp.

Tuy nhiên, có những ví dụ nổi tiếng về hệ thống ML sử dụng phương pháp học không giám sát. Google Lens sử dụng phương pháp học này để xác định các đối tượng từ hình ảnh tĩnh và trực tiếp. Một ví dụ khác là các thuật toán mà công ty an ninh mạng Darktrace sử dụng để phát hiện rò rỉ bảo mật nội bộ. Hệ thống ML của Darktrace sử dụng cách học không giám sát theo cách không khác gì hệ thống miễn dịch của con người.
“Nó rất giống hệ thống miễn dịch của cơ thể con người,” đồng giám đốc điều hành Nicole Eagan nói với MIT Technology Review. “Phức tạp như vậy, nó có ý thức bẩm sinh về cái gì là cái tôi và cái gì không phải cái tôi. Và khi nó tìm thấy thứ gì đó không thuộc về—cái đó không phải cái tôi—nó có một phản ứng cực kỳ chính xác và nhanh chóng.”
Phương pháp đào tạo thứ ba cũng xử lý dữ liệu chưa được gắn nhãn. Như vậy, học tăng cường cũng chỉ được sử dụng ở những người học sâu. Cả hệ thống không được giám sát và hệ thống được tăng cường đều xử lý dữ liệu với các mục tiêu cụ thể được xác định trước. Làm thế nào họ đạt được những mục tiêu này là nơi các thuật toán khác nhau.
Không giống như những người học không được giám sát, hoạt động trong các thông số cụ thể để dẫn họ đến mục tiêu cuối cùng, việc học tăng cường sử dụng một hệ thống tính điểm để hướng nó đến kết quả mong muốn.
Các thuật toán thử các cách khác nhau để đạt được mục tiêu của chúng và được khen thưởng hoặc bị phạt tùy thuộc vào việc phương pháp của chúng hiệu quả hay không hiệu quả trong việc thu được kết quả cuối cùng. Huấn luyện củng cố rất phù hợp để dạy AI cách chơi và giành chiến thắng trong các trò chơi như cờ vây, cờ vua, Dota 2 hoặc thậm chí là Pac-Man.
Hệ thống đào tạo này tương tự như chơi trò chơi Nóng và Lạnh với một đứa trẻ mới biết đi. Bạn bảo trẻ tìm quả bóng, và khi trẻ nhìn, bạn hướng dẫn trẻ bằng các từ củng cố “nóng hơn” và “lạnh hơn” dựa trên việc trẻ đang tiến gần hơn hay xa quả bóng hơn—sự củng cố. Sử dụng phương pháp học không giám sát, trẻ mới biết đi sẽ phải tìm quả bóng bằng cách đi theo bản đồ hoặc chỉ dẫn được xác định trước. Trong cả hai trường hợp, đứa trẻ vẫn phải tìm ra quả bóng là gì.
Học tăng cường là hình thức đào tạo mới nhất cho các hệ thống ML và đã được nghiên cứu ngày càng nhiều trong những năm gần đây. Như đã đề cập trước đó, trò chơi cờ đam năm 1952 của Arthur Samuel là một hình thức ban đầu của máy học tăng cường. Giờ đây, những người học sâu như AlphaGo của Google và bot Dota 2 của OpenAi, “Five”, sử dụng phương pháp học tăng cường để đánh bại những người chơi chuyên nghiệp trong các trò chơi phức tạp hơn nhiều so với cờ đam.
Mặc dù học máy đã xuất hiện trong nhiều thập kỷ, nhưng chỉ trong những năm gần đây, chúng ta mới thấy một cú hích lớn đối với các ứng dụng thực tế sử dụng công nghệ này. Rất có thể bạn thường xuyên sử dụng một thiết bị hoặc ứng dụng dựa trên các thuật toán ML. Điện thoại thông minh là một ví dụ rõ ràng, cũng như các ứng dụng khác nhau như trợ lý giọng nói, bản đồ và máy theo dõi tập thể dục. Ngoài ra còn có các trường hợp sử dụng khác ít rõ ràng hơn nhưng có thể làm những điều tuyệt vời.
Ngày nay, các hệ thống giám sát không chỉ là các máy quay video được gắn đơn giản được giám sát bởi nhân viên an ninh. Các hệ thống tiên tiến hiện sử dụng công nghệ máy học để tự động hóa các tác vụ khác nhau, bao gồm phát hiện hành vi đáng ngờ và theo dõi các cá nhân thông qua nhận dạng khuôn mặt.
Làm việc tại các sòng bạc ở Nevada trong nhiều năm, tôi đã tận mắt chứng kiến một hệ thống giám sát không chỉ có thể phát hiện những kẻ gian lận tiềm năng mà còn theo dõi kẻ tình nghi khắp sòng bạc, tự động chuyển sang bất kỳ camera nào có người đó trong tầm nhìn. Thật tuyệt vời khi xem hệ thống giám sát khi nó theo dõi ai đó trong sòng bạc và thậm chí vào bãi đậu xe mà không có bất kỳ sự can thiệp nào của con người.
“Thế giới đang cạn kiệt khả năng tính toán. Định luật Moore sắp hết hơi… [chúng ta cần điện toán lượng tử để] tạo ra tất cả những trải nghiệm phong phú mà chúng ta nói đến, tất cả trí tuệ nhân tạo này.” — Satya Nadella, Giám đốc điều hành Microsoft.
Các ứng dụng học máy mà chúng ta thấy ngày nay đã khá đáng kinh ngạc, nhưng tương lai sẽ ra sao? Lĩnh vực trí tuệ nhân tạo chỉ mới bắt đầu nở rộ.
Các thuật toán học máy và học sâu có vô số cơ hội phát triển và chúng tôi chắc chắn sẽ thấy nhiều ứng dụng thực tế hơn nữa thâm nhập vào thị trường người tiêu dùng và doanh nghiệp trong thập kỷ tới. Trên thực tế, Forbes lưu ý rằng 82% các nhà lãnh đạo tiếp thị đã áp dụng học máy để cải thiện khả năng cá nhân hóa. Vì vậy, chúng ta có thể mong đợi thấy ML được tận dụng thương mại trong quảng cáo được nhắm mục tiêu và cá nhân hóa dịch vụ trong tương lai.
Sự bùng nổ lớn tiếp theo có thể là học máy lượng tử. Các nhà nghiên cứu từ MIT, IBM và NASA đã thử nghiệm ứng dụng điện toán lượng tử vào học máy. Không có gì ngạc nhiên khi họ phát hiện ra rằng một số vấn đề nhất định có thể được giải quyết trong một khoảng thời gian ngắn đối với phần cứng xử lý hiện đại. Tương tự như vậy, Microsoft và Google gần đây đã công bố kế hoạch phát triển trong lĩnh vực ML lượng tử, vì vậy có khả năng chúng ta sẽ được nghe và thấy nhiều hơn về điều này trong tương lai gần.