#30 - Tự động sửa lỗi chính tả tiếng Việt
Clip hay cuối tuần
Những bài viết hay
Tự động sửa lỗi chính tả tiếng Việt — medium.com
Tự động phát hiện và sửa lỗi chính tả (Auto Correction) là một trong những bài toán cơ bản nhất trong xử lý ngôn ngữ tự nhiên. Tính năng này có trong các ứng dụng nhập liệu, nhận dạng…Với việc viết văn bản trên điện thoại di động rất dễ sinh ra lỗi, tính năng tự động sửa lỗi chính tả là thành phần không thể thiếu trong bất cứ bàn phím nào. Các kỹ thuật auto correction đã rất phát triển và hoạt động rất tốt với nhiều ngôn ngữ, nhất là tiếng Anh. Nhưng với tiếng Việt thì sao?
Building Pinterest’s A/B testing platform – Pinterest Engineering – Medium — medium.com
A/B testing là một kỹ thuật không mới. Khi áp dụng A/B testing thì chúng ta thường tạo ra 2 (hoặc nhiều hơn) phiên bản giao diện khác nhau và triển khai cho 2 (hoặc hơn) tập người dùng khác nhau, sau đó thu thập dữ liệu để đánh giá xem giao diện nào đáp ứng được các tiêu chí đề ra tốt hơn.
Tuy nhiên, nếu trong website của bạn có đến 1000 chỗ bạn muốn thử nghiệm A/B testing thì phải làm sao cho hiệu quả, phải quản lý dữ liệu thu thập được và config như thế nào? Đó là điều team Pinterest chia sẻ trong bài viết này.
Sự kiện nổi bật
TechTalk #27: Data Structures & Algorithms — www.facebook.com
Trong lĩnh vực Software Engineer, để xây dựng bất kỳ một ứng dụng hoặc một framework nào đó, ngoài tầm quan trọng của việc thiết kế hệ thống tốt, việc lựa những cấu trúc dữ liệu và giải thuật hợp lý cũng không kém phần quan trọng. Phía sau sự thành công của nhiều ứng dụng, framework, databases,.. đều dựa trên một (hoặc một vài) cấu trúc dữ liệu kèm theo giải thuật nào đó để giải quyết những bài toán nhất định!
Đến với TechTalk #27 các bạn sẽ được giới thiệu 2 cấu trúc dữ liệu và những giải thuật liên quan:
- Cách xây dựng một Optimal Binary Search Tree.
- Lưu trữ Hierrachical data trong Database như thế nào?
AngelHack Hackathon in Ho Chi Minh: Smart Mobility - Demo Day — www.facebook.com
Còn vài ngày nữa là đến Demo Day của Angelhack Hackathon, các bạn nào hứng thú với các sản phẩm công nghệ mang tính ứng dụng cao, đặc biệt là trong mảng giao thông thì đăng ký tham gia Demo Day để xem các đội thi trình bày ý tưởng nhé.
Buổi Demo Day ở HCM sẽ diễn ra vào ngày 22/7
Có thể bạn chưa biết
API có tính lũy đẳng (Idempotent API) là thuật ngữ nhằm chỉ một lời gọi API trả về giá trị như nhau sau nhiều lần gọi.
Ví dụ, một website có API dùng để like hình có đường dẫn như sau:
POST /image/{image_id}/like
Nếu API này trả về kết quả như bên dưới
{
status: "success"
}
Thì API này được xem là có tính lũy đẳng (idempotent). Ngược lại, nếu API này trả về kết quả như:
{
// like_count chỉ số người đã like post này
like_count: 20
}
Vậy thì API này sẽ được xem là không có tính lũy đẳng (idempotent).
Mỗi tuần một câu đố
Cảm ơn team Holistics Software đã cung cấp câu đố tuần này. Các team nào muốn gửi câu đố vui lòng gửi về newsletter@grokking.org
[OS] Tại sao 1 ứng dụng bị dính lỗi memory leaks thường sẽ chạy chậm lại trước khi crash?
A. Khi hệ thống gần hết memory, phân mảng (memory fragmentation) xuất hiện dẫn tới giảm tốc độ truy cập.
B. L1 cache sẽ hết bộ nhớ, dẫn đến việc CPU truy cập bộ nhớ ngoài nhiều hơn.
C. Khi hệ thống gần hết memory, swapping xảy ra dẫn tới giảm tốc độ truy cập.
D. Memory leaks dẫn đến có quá nhiều files được mở (too many files opened), dẫn đến giảm tốc độ truy cập.