Ray.io: Hệ thống phân tán mã nguồn mở cho AI (trí tuệ nhân tạo)
Năm 2018, viện nghiên cứu trí tuệ nhân tạo Berkeley (BAIR) của trường đại học California xuất bản bài báo khoa học về một hệ thống phân tán ứng dụng cho Artificial Intelligent: Ray.io. BAIR cũng là viện nghiên cứu từng tạo ra các hệ thống phân tán khác đang được sử dụng rộng rãi hiện nay như Spark, Apache Mesos, Caffe, vv.
Các thuật toán học máy trí tuệ nhân tạo ngày càng trở nên phức tạp, đòi hỏi khả năng xử lý dữ liệu lớn nhanh & hiệu quả với hệ thống phân tán và mô hình lập trình tính toán song song. Tuy nhiên, cơ sở hạ tầng phân tán dùng cho học máy thường ad-hoc, với nhiều giải pháp tốt khác nhau nhưng mỗi giải pháp chỉ giải quyết được một vài use-case hoặc một phần trong toàn bộ machine learning pipeline hoặc machine learning ecosystem (ví dụ: Hadoop, Spark). Các framework phân tán hiện có cũng không được xây dựng để hỗ trợ trực tiếp cho AI applications.
Các hệ thống hỗ trợ phát triển thuật toán machine learning, cho dù là thuật toán rất đơn giản như
Evolution Strategies for reinforcement learning, đặc biệt là các thuật toán Reinforcement Learning, đòi hỏi rất nhiều effort để giải quyết vấn đề về software engineering thay vì vấn đề về machine learning.
Ray.io ra đời để giải quyết vấn đề đó. Ray cung cấp hệ thống framework đồng nhất cùng với mô hình lập trình phân tán tối thiểu hoá (minimalist), hỗ trợ cho các application phân tán tốc độ cao chỉ bằng một vài dòng lệnh đơn giản.
Ray hoàn toàn tương thích với các frameworks hiện có dành cho deep learning (ví dụ: TensorFlow, PyTorch, MXNet), và hiện chỉ hỗ trợ cho Python, Java.