#78 - Chuyên đề "Trí Tuệ Nhân Tạo"

Jul 14, 2019

Những bài viết hay

How Does Spotify Know You So Well? — medium.com

Mỗi tuần, Spotify sẽ đưa ra những list nhạc "Discover Weekly" để gợi ý cho người dùng. Để đưa ra list nhạc đó, Spotify đã sử dụng 3 phương án kết hợp: Collaborative Filtering, Natural Language Processing (NLP) và Raw Audio Models. Bài viết sau sẽ giải thích về cách hoạt động cơ bản của ba mô hình trên, những luồng xử lý chính của Spotify's Recommendation, và từ đó đưa ra các playlist "Discover Weekly" mỗi tuần.

The AI technique that could imbue machines with the ability to reason — www.technologyreview.com

Trong một bài giảng mới đây của Yann LeCun, nhà khoa học AI chính tại Facebook và là giáo sư tại NYU, ông đã chia sẻ một viễn cảnh hấp dẫn về giai đoạn tiếp theo của Deep Learning.

Khi được sáu tháng tuổi, một em bé đã không để ý nếu một chiếc xe tải đồ chơi lái ra khỏi bục và dường như lơ lửng trong không trung. Nhưng thực hiện cùng một thí nghiệm chỉ hai đến ba tháng sau, và em bé sẽ ngay lập tức nhận ra rằng có điều gì đó không ổn. Lúc này, em bé đã học được khái niệm về trọng lực.

Không có ai nói với em bé rằng các đồ vật được cho là rơi xuống. Yann LeCun đưa ra giả thuyết, rất nhiều điều các em bé học được về thế giới là thông qua quan sát.

Lý thuyết đó có thể có ý nghĩa quan trọng đối với các nhà nghiên cứu hy vọng sẽ vượt qua ranh giới của trí tuệ nhân tạo.

Deep Learning, đã có những bước tiến lớn trong việc mang lại cho máy móc những khả năng nhận thức như tầm nhìn. Nhưng nó đã thất bại trong việc xây dựng chúng với lý luận tinh vi. Nói cách khác, máy không thực sự hiểu thế giới xung quanh, khiến chúng không thể tiếp cận được với nó.

Nhưng LeCun tin rằng đó chỉ là một mảnh của câu đố, rõ ràng là chúng ta thiếu một thứ gì đó. Một em bé có thể phát triển sự hiểu biết về một con voi sau khi xem hai bức ảnh, trong khi các thuật toán học sâu cần phải nhìn thấy hàng ngàn, nếu không phải là hàng triệu. Một thiếu niên có thể học lái xe an toàn bằng cách luyện tập trong 20 giờ và xoay sở để tránh va chạm, trong khi các thuật toán học tăng cường, reinforcement-learning algorithms, (một nhánh của Deep Learning) phải trải qua hàng chục triệu thử nghiệm, bao gồm nhiều thất bại nghiêm trọng.

Theo LeCun, câu trả lời là "unsupervised learning" một nhánh trong Deep Learning.

Các bạn có thể xem slide bài nói của ông tại đây.

How to solve 90% of NLP problems: a step-by-step guide — blog.insightdatascience.com

Cho dù bạn là một công ty đã thành lập hay đang làm việc để ra mắt một dịch vụ mới, bạn luôn có thể tận dụng dữ liệu văn bản để xác thực, cải thiện và mở rộng các chức năng của sản phẩm. Khoa học trích xuất ý nghĩa và học hỏi từ dữ liệu văn bản là một chủ đề nghiên cứu có tên là Xử lý ngôn ngữ tự nhiên - Natural Language Processing (NLP).

NLP là một lĩnh vực rất lớn. Tuy nhiên, khi làm việc với hàng trăm công ty, nhóm Insight đã thấy một vài ứng dụng thực tế quan trọng xuất hiện thường xuyên:

Xác định các nhóm người dùng/khách hàng khác nhau.
Phát hiện và trích xuất chính xác các loại phản hồi khác nhau. Ví dụ: đánh giá ý kiến tích cực và tiêu cực.
Phân loại văn bản theo ý định. Ví dụ: yêu cầu trợ giúp cơ bản, vấn đề khẩn cấp.

Tác giả đã viết bài đăng này để giải thích cách xây dựng các giải pháp Machine Learning để giải quyết các vấn đề như những vấn đề nêu trên. Bắt đầu với phương pháp đơn giản nhất có thể hoạt động, sau đó chuyển sang các giải pháp phức tạp hơn như Deep Learning.

Sau khi đọc bài viết này, bạn sẽ biết cách:

Thu thập, chuẩn bị và kiểm tra dữ liệu.
Xây dựng các mô hình đơn giản để bắt đầu và chuyển sang Deep Learning nếu cần thiết.
Giải thích và hiểu mô hình của bạn, để đảm bảo bạn thực sự nắm bắt thông tin.

Sách hay nên đọc

AI Superpowers: China, Silicon Valley, and the New World Order — www.goodreads.com

AI Superpowers là cuốn sách thực tế trong ngành công nghiệp AI, được viết bởi một cựu chiến binh trong lĩnh vực này, Lý Khai Phục. Nó cho ta thấy cho cuộc đua AI giữa Hoa Kỳ và Trung Quốc, những người khổng lồ của thế giới.

Điều độc đáo của cuốn sách này là nó cho bạn một cái nhìn sâu sắc về những đổi mới AI xảy ra ở Trung Quốc. Lý Khai Phục dành thời gian để hướng dẫn bạn suy nghĩ về tinh thần kinh doanh và tâm lý kinh doanh của Trung Quốc - để hiểu không chỉ về đổi mới AI, mà là toàn bộ tư duy của đất nước. Bằng cách đọc cuốn sách này, bạn sẽ có một bức tranh rõ ràng hơn về toàn bộ nửa kia của cuộc đua trí tuệ nhân tạo: Trung Quốc.

Code & Tools

Python Machine Learning Tutorial: Predicting Airbnb Prices — www.dataquest.io

Tutorial này được thiết kế để giới thiệu cho bạn các khái niệm cơ bản trong Machine Learning. Khi bạn làm theo, bạn sẽ xây dựng một model để dự đoán, và hiểu chính xác cách mô hình đã hoạt động như thế nào. Tutorial sử dụng Python và thuật toán k-nearest neighbors để dự đoán giá Airbnb.

Tin tức từ công ty

Our Commitment to Lead the Fight Against Online Bullying — instagram-press.com

Instagram đang sử dụng AI để ngăn chặn những bình luận xấu. Các bình luận xấu luôn là một vấn đề phức tạp vì quy mô và sắc thái của nó. Những điều đơn giản như các comment mang ý mỉa mai hoặc thậm chí sai chính tả có thể khiến hệ thống hiểu nhầm ý nghĩa của thông điệp.

Instagram, hiện đang thử một cách tiếp cận mới. Thay vì chỉ dựa vào các thuật toán của nó để kiểm duyệt, nó cũng sẽ thu hút người dùng Tự kiểm duyệt. Khi một bình luận được đăng, nếu mô hình AI của nền tảng đánh dấu nó là có hại, người đăng sẽ thấy một câu hỏi bật lên, "Bạn có chắc chắn muốn đăng bài này không?". Trong các thử nghiệm đầu tiên, Instagram đã thấy tính năng khuyến khích nhiều người hủy bỏ ý kiến của họ. Đó là một chiến thuật thông minh để cố gắng giảm bớt một số gánh nặng về kiểm duyệt nội dung.

Amazon Alexa will now be giving out health advice to UK citizens — www.technologyreview.com

Bắt đầu từ tuần này, khi người dùng ở Anh hỏi Echo những câu hỏi liên quan đến sức khỏe của họ (ví dụ: Các triệu chứng của bệnh cúm là gì?), nó sẽ tự động tìm kiếm trang web chính thức của Dịch vụ Y tế Quốc gia để biết các lời khuyên về sức khỏe và hỗ trợ về mặt y tế. Trước đây, nó sẽ trả lời các câu hỏi như vậy dựa trên các câu trả lời phổ biến.

Tin tức khác

Có thể bạn chưa biết

Làm thế nào để thông minh hơn? — medium.com

Hẳn một số bạn sẽ cảm thấy khó khăn khi phải giải thích các ý nghĩ của mình, ví dụ như khi viết email, hay khi nói chuyện với đồng nghiệp.

Vậy làm thế nào để chúng ta có thể phát triển được nhiều thêm các sự liên kết trong trí óc của mình, qua đó có thể nói chuyện cuốn hút hơn và viết nhanh hơn? Mời các bạn cùng đọc bài dịch sau nhé.

Sự kiện nổi bật

Saigon Code Tour — codetour.vn

Saigon Code Tour – Cuộc thi “code dạo” độc đáo nhất Việt Nam đã trở lại. Đây là sân chơi dành cho developer đủ mọi lứa tuổi với tổng giải thưởng lên đến 100 triệu đồng tiền mặt! Trải qua 4 #Codechallenge, người tham dự sẽ dùng các ngôn ngữ và môi trường lập trình phù hợp để giải các bài toán kỹ thuật đầy thách thức.

Tham khảo thêm và đăng ký ở đây: https://codetour.vn/

THIS WEEK'S SPONSOR

Team biên tập xin gửi lời cảm ơn đến VNG, nhà tài trợ cho số newsletter tuần này.

Được thành lập từ năm 2004, VNG Corporation là một trong những công ty Internet Công Nghệ hàng đầu tại Việt Nam, được vinh danh là start-up kỳ lân đầu tiên của Việt Nam tính đến thời điểm hiện tại. VNG nuôi dưỡng hệ sinh thái dịch vụ đa dạng như trò chơi trực tuyến, nền tảng kết nối, tài chính, thanh toán, dịch vụ đám mây… Với sứ mệnh “thay đổi Internet để thay đổi cuộc sống người Việt”, VNG không ngừng cải tiến và hoàn thiện hơn các sản phẩm giúp người dùng có những trải nghiệm ấn tượng và tốt đẹp.

VNG hiện có 3 văn phòng tại Việt Nam (Hồ Chí Minh, Hà Nội, Đà Nẵng) và 3 văn phòng tại các nước Thái Lan, Singapore, Myanmar.

Quote

"Sometimes the problem is to discover what the problem is." - Gordon Glegg

Discussion about this post

Ready for more?