Hôm nay,  
Việt Báo Online

Máy Học Machine Learning Đoán Kết Quả World Cup 2018

19/06/201800:00:00(Xem: 628)
Máy Học Machine Learning Đoán Kết Quả World Cup 2018
Machine Learning
Nhiều nhà nghiên cứu đã thử tìm cách dự đoán kết quả của mùa World Cup 2018. Nhiều công ty đã sử dụng các nhà thống kê chuyên nghiệp để phân tích cơ sở dữ liệu để định lượng xác suất kết quả của các trận đấu. Một cách ước tính khá tốt là kết hợp những tỷ lệ cược lấy từ những người đặt cược, trong đó Brazil là đội được yêu thích nhất, với xác suất thắng World Cup là 16.6%, theo sau là Đức 12.8% và Tây Ban Nha 12.5%. Tuy nhiên, trong những năm gần đây, các nhà nghiên cứu cũng đã phát triển được những kỹ thuật máy học machine learning có khả năng làm tốt hơn nhiều so với những phương pháp thống kê thông thường.

Vậy những phương pháp đã dự đoán kết quả của World Cup 2018 như thế nào?

Một câu trả lời từ công trình nghiên cứu của Andreas Groll tại Đại học Kỹ thuật Dortmund ở Đức và các cộng sự. Nhóm đã kết hợp các công cụ máy học và các phương pháp thống kế thông thường, một phương pháp được gọi là cách tiếp cận gọi là Random Forest, để xác định được đội có khả năng cao dành được chiến thắng.

Trong vài năm trở lại đây, phương pháp Random Forest được coi là một công cụ mạnh mẽ, có khả năng phân tích những tập dữ liệu lớn, đồng thời tránh được cạm bẫy của các phương pháp khai thác dữ liệu khác. Random Forest dựa trên nguyên lý rằng những sự kiện xảy ra trong tương lai có thể được quyết định bởi một biểu đồ quyết định hình cây, nơi kết quả sẽ được tính toán tại mỗi nhánh bằng cách tham chiếu đến tập huấn luyện.

Tuy nhiên, cây quyết định decision trees có một vấn đề phổ biến. Trong những giai đoạn sau của quá trình phân nhánh, các quyết định có thể bị bóp méo nghiêm trọng, bởi tập huấn luyện rất thưa thớt và dễ có biến đổi lớn, một vấn đề được gọi là mô hình quá khớp overfitting.

Cách tiếp cận Random Forest lại khác một chút. Thay vì phải tính kết quả tại mỗi nhánh, quá trình tính kết quả ở những nhánh ngẫu nhiên. Và công đoạn được làm nhiều lần, mỗi lần với một tập gồm nhiều nhánh được chọn ngẫu nhiên. Kết quả cuối cùng là trung bình của tất cả những cây quyết định decision trees. Cách tiếp cận mới có những lợi thế đáng kể. Đầu tiên, nó không gặp phải vấn đề mô hình quá khớp như trong những cây quyết định decision trees thông thường. Nó cũng cho thấy yếu tố nào là quan trọng nhất trong việc xác định kết quả.

Vì thế, nếu một cây quyết định decision tree có chứa nhiều tham số, có thể dễ dàng thấy được tham số nào có ảnh hưởng lớn nhất đến kết quả. Sau đó, những yếu tố ít quan trọng hơn có thể sẽ bị bỏ qua trong tương lai.

Groll và cộng sự đã sử dụng cách tiếp cận để mô phỏng World Cup 2018. Nhóm đã mô hình hoá kết quả của mỗi trận đấu và sử dụng các kết quả để dựng lên một giải đấu có xác suất xảy ra cao nhất.

Nhóm bắt đầu với một loạt cấc yếu tố tiềm năng mà có thể được sử dụng để xác định kết quả. Các yếu tố bao gồm các yếu tố kinh tế như GDP hay dân số của quốc gia, xếp hạng FIFA của đội tuyển quốc gia, tài sản của từng đội, cũng như độ tuổi trung bình, số cầu thủ Champions League mà họ có, hay liệu họ có lợi thế chủ nhà hay không,...

Thậm chí, cách tiếp cận Random Forest còn cho phép sử dụng cả những thứ hạng mà những người đặt cược sử dụng. Nhóm nghiên cứu sẽ sử dụng những thông tin trong mô hình và có được những thông tin chi tiết khá thú vị. Chẳng hạn như, những yếu tố có ảnh hưởng nhiều nhất là thông tin về các thứ hạng như thứ hạng FIFA, thứ hạng của những tay đặt cược,...

Những yếu tố quan trọng khác bao gồm GDP và số cầu thủ Champions League trong đội của các nước. Những yếu tố không quan trọng bao gồm dân số của quốc gia, quốc tịch của huấn luyện viên,... Và, phương pháp Random Forest đã chọn Tây Ban Nha là đội có khả năng chiến thắng cao nhất, với xác suất là 17.8%.

Tuy nhiên, yếu tố quan trọng trong dự đoán là cấu trúc của giải đấu. Nếu Đức vượt qua được vòng loại nhóm, có nhiều khả năng là họ sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội.Vì vậy phương pháp Random Forest đã ước tính cơ hội để Đức đạt được vào vòng tứ kết là 58%. Trái lại, Tây Ban Nha có ít khả năng sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội, vì thế họ có 73% cơ hội được đi vào vòng tứ kết.

Nếu cả hai đội Đức và Tây Ban Nha cùng đi vào vòng tứ kết, tỷ lệ chiến thắng của họ là gần bằng nhau. Nhóm nghiên cứu cho rằng: “Tây Ban nha được ưu ái hơn một chút so với Đức vì Đức có khả năng khá cao là sẽ bị loại trong vòng chọi 16 đội”

Tuy nhiên, có một điều bất ngờ khác: Quá trình cây ngẫu nhiên decision trees có thể mô phỏng toàn bộ giải đấu, và quá trình đã đưa ra một kết quả hoàn toàn khác. Nhóm nghiên cứu đã mô phỏng toàn bộ giải đấu 100,000 lần. Kết quả cho thấy: “Theo như mô phỏng giải đấu có khả năng xảy ra cao nhất, thay vì Tây Ban Nha, Đức mới là đội sẽ thắng World Cup”. Dù vậy, do số lượng hoán vị rất lớn của giải đấu, khả năng vẫn có thể rất khó xảy ra, ước tính khả năng xảy ra trường hợp Đức vô địch là 1/100,000. Nhìn chung, vào đầu giải đấu, Tây Ban Nha có khả năng chiến thắng cao, nhưng nếu Đức có thể vào được vòng tứ kết, họ sẽ có khả năng chiến thắng cao hơn.

Nguoivietphone.com.

14/12/2018(Xem: 452)
OTTAWA - Ông Michael Spavor, thương gia Canada, vừa bị bắt tại Hoa Lục với lý do: đe dọa an ninh quốc gia.
14/12/2018(Xem: 184)
ANKARA - Tai nạn tại 1 ga xe lửa tại khu vực thủ đô Thổ Nhĩ Kỳ gây thiệt mạng ít nhất 9 người, 47 người bị thương, theo tin từ Bộ vận tải. Phóng viên địa phương cho hay: 2 đoàn xe cao tốc đụng nhau.
14/12/2018(Xem: 247)
BRUSSELS - Giới lãnh đạo EU sẽ loan báo đề nghị tăng trợ giúp Ukraine khi họp thượng đỉnh trong ngày Thứ Năm – nhưng lời hô hào tăng trừng phạt Nga về vụ đụng chạm hải quân tại Biển Azov sát bên bán đảo Crimea hôm 25-11 thiếu hậu thuẫn.
14/12/2018(Xem: 205)
BAGHDAD - Amnesty International lên án “nhà nước Hồi Giáo – ISIS” cố tình bóp nghẹt nông thôn tại miền bắc Iraq là tội ác chiến tranh.
14/12/2018(Xem: 235)
RIYADH - Vương triều Al Saudi đang nỗ lực tạo ra 1 liên minh chính trị với Ai Cập, Sudan, Somalia, Djibouti, Jordan, và Yemen để chống lại các đối thủ vùng, là Thổ Nhĩ Kỳ, Iran và Qatar.
14/12/2018(Xem: 149)
STOCKHOLM - Viên chức LHQ tham dự hòa hội Yemen đang diễn ra tại Thụy Điển báo tin: các phe thỏa thuận ngưng bắn tại Hodeida.
14/12/2018(Xem: 560)
NEW DEHLI - 1 nhà sư đang nhập định dưới gốc cây trong rừng Tadoba của tỉnh bang Maharashtra bị beo tấn công, đã chết. Rừng Tadoba là vùng bảo tồn cọp, beo.
14/12/2018(Xem: 180)
Biến đổi khí hậu sẽ làm thiệt hại tất cả môi trường trên địa cầu... Riêng tại Nhật Bản: 60% bãi cát có thể biến mất do biến đổi khí hậu... Bản tin NHK ghi rằng giới nghiên cứu cho biết có đến 60% bãi cát ở Nhật Bản có thể sẽ biến mất trước cuối thế kỷ này, do trái đất ấm lên khiến mực nước biển dâng cao.
13/12/2018(Xem: 1364)
TIJUANA - 2 tổ chức bảo vệ di dân Trung Mỹ tuần hành tới lãnh sự quán Hoa Kỳ tại Tijuana để nộp đề nghị chính quyền Trump cho nhập cư, hoặc cấp 50,000 MK/người để họ hồi hương.
13/12/2018(Xem: 261)
WASHINGTON - Chuyên gia Richard F. Hohlt, đại diện của sứ quán Saudi Arabia để vận động hành lang với chính quyền Hoa Kỳ, đã thôi việc, theo hồ sơ đệ nạp Bộ tư pháp.
13/12/2018(Xem: 511)
WASHINGTON - Bộ ngân khố xác nhận tin doanh nghiệp Yantai Jereh trụ sở Hoa Lục thuận dàn xếp vi phạm lệnh trừng phạt Iran bằng trên 2.7 triệu MK.
13/12/2018(Xem: 463)
VANCOUVER - Meng Zhanhou, là giám đốc tài chính của đại công ty Huawei chuyên sản xuất smartphone, đã được tòa Canada cho tại ngoại hầu tra. Meng bị bắt hôm 1-12 theo yêu cầu từ chính quyền Trump.
13/12/2018(Xem: 839)
WASHINGTON - Bạch Ốc xác nhận quyết định của Nga rút 2 oanh tạc cơ chiến lược có khả năng mang bom nguyên tử từ Venezuela, là ngưng sự điều động gây phản đối quyết liệt của Hoa Kỳ.
13/12/2018(Xem: 265)
PARIS - Cảnh sát Pháp bắt 5 người có liên quan với vụ nổ súng tối Thứ Ba tại chợ Giáng sinh của thành phố Strasbourg gây thiệt mạng 2 người và 14 gười bị thương -hung thủ là 1 phần tử quá khích.
13/12/2018(Xem: 336)
LONDON - 15% nhà lập pháp của đảng Bảo Thủ đề nghị biểu quyết bất tín nhiệm Thủ Tướng Theresa May - khối dân cử Bảo Thủ đã định tổ chức biểu quyết vào tối Thứ Tư về vai trò lãnh đạo của bà sau khi thu 48 phiếu tán đồng.
Tin công nghệ
Vào ngày 29/10/2018, tàu vũ trụ Juno một lần nữa bay đến gần các đỉnh mây phức tạp Jovian. Lần tiếp cận điểm trên quỹ đạo gần trung tâm nhất thứ 16, hay là bay qua điểm perijove* thứ 16, đã đưa Juno vào trong phạm vi 3,500 km của bầu khí quyển hành tinh lớn nhất của Hệ Mặt trời.
Khoảng giữa tháng 12/2018, ASUS đã gửi đi một thông báo quan trọng về việc thay đổi đội ngũ quản lý và các định hướng phát triển trong tương lai.
Khoảng giữa tháng 12/2018, toàn bộ nước Mỹ đã trở nên hỗn loạn vì hàng triệu người nhận được email đe dọa đánh bom. Những kẻ tấn công đe dọa sẽ cho nổ văn phòng làm việc hoặc nhà riêng của nạn nhân, nếu không gửi cho chúng 20,000 USD dưới dạng Bitcoin, tới một địa chỉ ví điện tử.
Khoảng giữa tháng 12/2018, một số nguồn tin cho biết, Facebook đang đàm phán với các kênh truyền hình trả tiền, bao gồm HBO, Showtime và Starz về thỏa thuận bán các dịch vụ trên Facebook. Người dùng ghi danh thuê bao có thể xem chúng trên các nền tảng của Facebook hoặc các nền tảng và thiết bị khác như Roku TV. Đây chính là mô hình Amazon đã làm trong vài năm và Apple đang muốn cung cấp vào năm 2019.
Khoảng giữa tháng 12/2018, chương trình sức khỏe trí tuệ nhân tạo AI được Google triển khai ở Thái Lan nhằm điều trị bệnh lý võng mạc tiểu đường có thể dẫn tới mù lòa.
Khoảng giữa tháng 12/2018, Qualcomm đã giành phần thắng cuộc chiến pháp lý tại Trung Quốc trong vụ kiện Apple vi phạm bằng sáng chế và Apple đã bị cấm bán một số mẫu iPhone tại thị trường. Tuy nhiên, Apple vẫn “lách luật” bằng cách cài hệ điều hành mới vào các mẫu iPhone vi phạm.
Khoảng giữa tháng 12/2018, một số nguồn tin cho biết, nữ danh ca Taylor Swift đã tổ chức một buổi hòa nhạc lại Rose Bowl, California tháng 05/2018. Điều đặc biệt là những người tới dự buổi hòa nhạc này được theo dõi bởi một hệ thống nhận dạng gương mặt tiên tiến. Mục tiêu của hệ thống là các stalker, những kẻ xấu chuyên bám theo và làm phiền Taylor Swift
Theo các thông tin được ghi nhận tính tới tháng 12/2018, có vẻ như các nhà khoa học Trung Quốc đã thực sự chỉnh sửa gen cho một loạt các phôi thai, từ đó sinh ra 2 bé gái “được thiết kế gen” đầu tiên trong lịch sử.
Khoảng giữa tháng 12/2018, YouTube thông báo rằng trong vài ngày tiếp theo hãng sẽ tiến hành xóa các subscription giả, spam của các kênh trên nền tảng của mình. Động thái này là một phần của công tác kiểm tra thường xuyên nhằm đảm bảo rằng các kênh không bị "thổi phồng" bằng những công cụ spam.
Khoảng giữa tháng 12/2018, phiên bản mới nhất của trình duyệt Firefox dành cho máy tính để bàn và Android – Firefox 64 – đã được ra mắt. Firefox 64 đi kèm với một vài tính năng tiện lợi để sử dụng tab và các phần mở rộng extension chuyên sâu hơn.
Khi máy tính của quý vị lưu trữ dữ liệu, nó phải tạm dừng vài mili giây để thông tin di chuyển từ phần cứng này sang phần cứng khác, chẳng hạn từ RAM sang ổ cứng. Một vài mili giây có thể không phải là vấn đề gì với quý vị, nhưng nó sẽ trở thành vấn đề với những cỗ máy sever, phải lưu trữ một lượng dữ liệu cực lớn trong kỷ nguyên số hiện nay.
Khoảng giữa tháng 12/2018, một số nguồn tin cho biết, Apple đang phát triển chip 4G riêng của hãng để thay thế các giải pháp của Qualcomm và Intel. Hãng cũng đang tuyển nhiều kĩ sư để thiết kế con chip mới, cũng như mở rộng số nhân sự làm việc với những thành phần liên quan tới sóng radio cho iPhone.
Đeo kính 3D (Anaglyph glass) và nhìn qua tiểu hành tinh 101955 Bennu. Có hình dạng như một món đồ chơi xoay tròn cùng những tảng đá vương vãi trên bề mặt gồ ghề, thế giới thu nhỏ của Hệ Mặt trời có kích thước cỡ một Tòa nhà Empire State (chưa đầy 500 mét).
Nếu trước đây chúng ta đã có bộ nhớ 3D NAND với nhiều lớp bán dẫn xếp chồng lên nhau nhằm tạo ra những chiếc ổ cứng với kích thước nhỏ gọn nhưng có dung lượng và hiệu năng cực lớn, hiện Intel cũng sẽ dùng cách “xếp chồng” đó để tạo ra những con CPU 3D với nhiều tính năng ưu việt hơn.
Khoảng giữa tháng 12/2018, MediaTek đã ra mắt chip Helio P90 (MT6779V) tại một sự kiện ở Bắc Kinh, Trung Quốc. Đây là một con chip được xây dựng trên quy trình 12nm và mạnh mẽ hơn so với Helip P70.