Vài năm trở lại đây, công nghệ machine vision – máy nhìn đạt được nhiều đột phá, đã trở thành phần không thể thiếu của các hệ thống tích hợp trí tuệ nhân tạo, ví dụ như robot làm việc hay xe tự lái.
Thông thường, thông tin dưới dạng hình ảnh đi vào camera sẽ được biến đổi sang dạng số, thuật toán sẽ lãnh trách nhiệm xử lý chúng. Lượng dữ liệu đầu vào thường rất lớn (mà đa số trong số đó lại là dữ liệu thừa), khi đi qua một loạt các thay đổi biến dữ liệu từ dạng này sang dạng khác, kết quả cuối cùng sẽ vừa có tốc độ khung hình thấp mà quá trình xử lý dữ liệu lại rất tốn năng lượng. Tuy nhiên, ta có tin tốt rồi đây.
Các nhà nghiên cứu tại Viện Lượng tử Ánh sáng Vienna, Áo tạo ra một loại mắt nhân tạo mới, kết hợp linh kiện cảm biến ánh sáng với một mạng neural, đặt vừa cả hai trên một con chip nhỏ. Chúng có khả năng xử lý hình ảnh chỉ trong vài nano-giây, nhanh hơn bất kỳ cảm biến hình ảnh nào khoa học đang sở hữu.
Thiết kế công nghệ mới vừa được đăng tải trên tạp chí khoa học Nature, cho thấy nhóm nghiên cứu đã vận dụng sự kỳ diệu của tự nhiên vào công nghệ: họ tìm cách bắt chước quá trình xử lý hình ảnh của mắt động vật – những con mắt có thể xử lý xong được dữ liệu đầu vào trước khi đưa tín hiệu về não bộ.
Đội ngũ các nhà khoa học làm chip từ một tấm Tungsten diselenide (WSe2, một hợp chất của vonfram và selen) với độ dày tương đương vài nguyên tử xếp sát nhau, trên tấm WSe2 là hàng loạt diode cảm biến ánh sáng. Sau đó, họ gắn con chip này vào một mạng neural.
WSe2 khiến con chip mang trên mình thuộc tính điện đặc biệt, cho phép các nhà khoa học dễ dàng điều chỉnh được độ nhạy sáng của các diode. Điều này đồng nghĩa với việc mạng neural có thể được học một loạt phương pháp xác định thông tin hình ảnh đầu vào chỉ bằng việc chỉnh độ nhạy sáng của diode, chỉnh liên tục cho tới khi chúng cho ra kết quả chính xác.
Bằng cách này, con chip có thể nhanh chóng nhận biết được những chữ cái n, v và z được viết cách điệu.
Cảm biến mới cho phép công nghệ machine vision “nhìn” được nhanh hơn, hiệu quả hơn, thế nhưng chặng đường ứng dụng vẫn còn dài lắm: “con mắt” này chỉ chứa được 27 cảm biến ánh sáng và chỉ nhìn được hình ảnh cỡ 3×3.
Vẫn có những đặc điểm khiến công nghệ này khả quan hơn trước, đủ để các nhà nghiên cứu tin tưởng rằng việc tăng quy mô hệ thống sẽ không quá phức tạp. Cụ thể, con chip có thể tự mình thực hiện những tác vụ máy học mà không cần sự can thiệp của các nhà khoa học, ví dụ như xác định và mã hóa ký tự.
Khi có thể “thả” cho hệ thống trí tuệ nhân tạo tự xử lý hình ảnh để học dần, ta sẽ bớt được thời gian giám sát chúng.
Nguồn : Genk/Trithuctre