Hôm nay,  

Máy Học Machine Learning Đoán Kết Quả World Cup 2018

19/06/201800:00:00(Xem: 2496)
Machine Learning
Nhiều nhà nghiên cứu đã thử tìm cách dự đoán kết quả của mùa World Cup 2018. Nhiều công ty đã sử dụng các nhà thống kê chuyên nghiệp để phân tích cơ sở dữ liệu để định lượng xác suất kết quả của các trận đấu. Một cách ước tính khá tốt là kết hợp những tỷ lệ cược lấy từ những người đặt cược, trong đó Brazil là đội được yêu thích nhất, với xác suất thắng World Cup là 16.6%, theo sau là Đức 12.8% và Tây Ban Nha 12.5%. Tuy nhiên, trong những năm gần đây, các nhà nghiên cứu cũng đã phát triển được những kỹ thuật máy học machine learning có khả năng làm tốt hơn nhiều so với những phương pháp thống kê thông thường.

Vậy những phương pháp đã dự đoán kết quả của World Cup 2018 như thế nào?

Một câu trả lời từ công trình nghiên cứu của Andreas Groll tại Đại học Kỹ thuật Dortmund ở Đức và các cộng sự. Nhóm đã kết hợp các công cụ máy học và các phương pháp thống kế thông thường, một phương pháp được gọi là cách tiếp cận gọi là Random Forest, để xác định được đội có khả năng cao dành được chiến thắng.

Trong vài năm trở lại đây, phương pháp Random Forest được coi là một công cụ mạnh mẽ, có khả năng phân tích những tập dữ liệu lớn, đồng thời tránh được cạm bẫy của các phương pháp khai thác dữ liệu khác. Random Forest dựa trên nguyên lý rằng những sự kiện xảy ra trong tương lai có thể được quyết định bởi một biểu đồ quyết định hình cây, nơi kết quả sẽ được tính toán tại mỗi nhánh bằng cách tham chiếu đến tập huấn luyện.

Tuy nhiên, cây quyết định decision trees có một vấn đề phổ biến. Trong những giai đoạn sau của quá trình phân nhánh, các quyết định có thể bị bóp méo nghiêm trọng, bởi tập huấn luyện rất thưa thớt và dễ có biến đổi lớn, một vấn đề được gọi là mô hình quá khớp overfitting.

Cách tiếp cận Random Forest lại khác một chút. Thay vì phải tính kết quả tại mỗi nhánh, quá trình tính kết quả ở những nhánh ngẫu nhiên. Và công đoạn được làm nhiều lần, mỗi lần với một tập gồm nhiều nhánh được chọn ngẫu nhiên. Kết quả cuối cùng là trung bình của tất cả những cây quyết định decision trees. Cách tiếp cận mới có những lợi thế đáng kể. Đầu tiên, nó không gặp phải vấn đề mô hình quá khớp như trong những cây quyết định decision trees thông thường. Nó cũng cho thấy yếu tố nào là quan trọng nhất trong việc xác định kết quả.

Vì thế, nếu một cây quyết định decision tree có chứa nhiều tham số, có thể dễ dàng thấy được tham số nào có ảnh hưởng lớn nhất đến kết quả. Sau đó, những yếu tố ít quan trọng hơn có thể sẽ bị bỏ qua trong tương lai.

Groll và cộng sự đã sử dụng cách tiếp cận để mô phỏng World Cup 2018. Nhóm đã mô hình hoá kết quả của mỗi trận đấu và sử dụng các kết quả để dựng lên một giải đấu có xác suất xảy ra cao nhất.

Nhóm bắt đầu với một loạt cấc yếu tố tiềm năng mà có thể được sử dụng để xác định kết quả. Các yếu tố bao gồm các yếu tố kinh tế như GDP hay dân số của quốc gia, xếp hạng FIFA của đội tuyển quốc gia, tài sản của từng đội, cũng như độ tuổi trung bình, số cầu thủ Champions League mà họ có, hay liệu họ có lợi thế chủ nhà hay không,...

Thậm chí, cách tiếp cận Random Forest còn cho phép sử dụng cả những thứ hạng mà những người đặt cược sử dụng. Nhóm nghiên cứu sẽ sử dụng những thông tin trong mô hình và có được những thông tin chi tiết khá thú vị. Chẳng hạn như, những yếu tố có ảnh hưởng nhiều nhất là thông tin về các thứ hạng như thứ hạng FIFA, thứ hạng của những tay đặt cược,...

Những yếu tố quan trọng khác bao gồm GDP và số cầu thủ Champions League trong đội của các nước. Những yếu tố không quan trọng bao gồm dân số của quốc gia, quốc tịch của huấn luyện viên,... Và, phương pháp Random Forest đã chọn Tây Ban Nha là đội có khả năng chiến thắng cao nhất, với xác suất là 17.8%.

Tuy nhiên, yếu tố quan trọng trong dự đoán là cấu trúc của giải đấu. Nếu Đức vượt qua được vòng loại nhóm, có nhiều khả năng là họ sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội.Vì vậy phương pháp Random Forest đã ước tính cơ hội để Đức đạt được vào vòng tứ kết là 58%. Trái lại, Tây Ban Nha có ít khả năng sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội, vì thế họ có 73% cơ hội được đi vào vòng tứ kết.

Nếu cả hai đội Đức và Tây Ban Nha cùng đi vào vòng tứ kết, tỷ lệ chiến thắng của họ là gần bằng nhau. Nhóm nghiên cứu cho rằng: “Tây Ban nha được ưu ái hơn một chút so với Đức vì Đức có khả năng khá cao là sẽ bị loại trong vòng chọi 16 đội”

Tuy nhiên, có một điều bất ngờ khác: Quá trình cây ngẫu nhiên decision trees có thể mô phỏng toàn bộ giải đấu, và quá trình đã đưa ra một kết quả hoàn toàn khác. Nhóm nghiên cứu đã mô phỏng toàn bộ giải đấu 100,000 lần. Kết quả cho thấy: “Theo như mô phỏng giải đấu có khả năng xảy ra cao nhất, thay vì Tây Ban Nha, Đức mới là đội sẽ thắng World Cup”. Dù vậy, do số lượng hoán vị rất lớn của giải đấu, khả năng vẫn có thể rất khó xảy ra, ước tính khả năng xảy ra trường hợp Đức vô địch là 1/100,000. Nhìn chung, vào đầu giải đấu, Tây Ban Nha có khả năng chiến thắng cao, nhưng nếu Đức có thể vào được vòng tứ kết, họ sẽ có khả năng chiến thắng cao hơn.

Nguoivietphone.com.

Gửi ý kiến của bạn
Vui lòng nhập tiếng Việt có dấu. Cách gõ tiếng Việt có dấu ==> https://youtu.be/ngEjjyOByH4
Tên của bạn
Email của bạn
)
✱ TT Putin: “Mục tiêu của chúng tôi không phải là đẩy nhanh guồng máy xung đột quân sự, mà trái lại là chấm dứt cuộc chiến hiện nay” - "Chúng tôi sẽ cố gắng chấm dứt cuộc chiến này, và tất nhiên là càng sớm càng tốt." ✱ PNV/TBÔ John Kirby: Ông Putin "hoàn toàn không cho thấy dấu hiệu nào rằng ông ta sẵn sàng đàm phán" để chấm dứt chiến tranh - Ông Biden sẵn sàng đàm phán với ông Putin, nhưng chỉ khi nào nhà lãnh đạo Nga "thể hiện sự nghiêm túc về đàm phán"...
Mãi cho đến dạo gần đây, hầu hết những ai không sống ở Iran có thể sẽ chưa bao giờ nghe đến cụm từ ‘cảnh sát đạo đức,’ chứ đừng nói là biết được vai trò rộng lớn của họ ở đất nước này. Tuy nhiên, ngày 16 tháng 9 năm 2022, cái chết của Jina Mahsa Amini đã làm dấy lên hàng loạt cuộc biểu tình trên đường phố Iran và các nơi khác, và tới này vẫn chưa có dấu hiệu dịu đi. Amini đã bị Gasht-e-Ershad, tên tiếng Ba Tư của lực lượng cảnh sát khét tiếng này, giam giữ vì tội “không buộc khăn trùm đầu phù hợp.”
Thế giới đang đối mặt với một bước ngoặt của thời đại: một sự thay đổi kiến tạo cho thời đại. Cuộc chiến tranh xâm lược Ukraine của Nga đã kết thúc một kỷ nguyên. Các cường quốc mới đã hoặc tái xuất hiện, bao gồm một Trung Quốc hùng mạnh về kinh tế và kiên quyết về chính trị. Trong thế giới đa cực mới này, các quốc gia và mô hình chính phủ khác nhau đang cạnh tranh về quyền lực và ảnh hưởng.
Một phong trào biểu tình chống chế độ và chống Xi, do dân chúng và phần đông giới trẻ, sinh viên các Đại học, phát động hôm 24/11/22, nhiều người cho là lớn nhứt từ 33 năm nay. Dân chúng các thành phố lớn, sinh viên từ nhiều Đại học xuống đường tố cáo biện pháp ác ôn « Zéro Covid » của Xi chống dịch Vũ Hán là giết người, trong lúc thế giới cũng chống dịch nhưng không ai làm như vậy...
Cuộc chiến hiện nay tại Ukraine, chẳng cần nói nhiều, đã là một bài học rất lớn cho Hoa Kỳ, và có lẽ nó sẽ được dùng làm chuẩn mực cho những xung đột trong tương lai giữa Hoa Kỳ và các thế lực thù địch trên thế giới...
✱ Reuters: Nga đang hy vọng rằng đảng Cộng hòa kiểm soát Quốc hội - Chính quyền Biden sẽ gặp khó khăn trong việc thúc đẩy Quốc hội thông qua các chương trình viện trợ cho Kyiv. ✱ Military: Các nhà vận động hành lang làm việc cho các nhà thầu quốc phòng, đã từng làm việc cho chính phủ liên bang trước đây - cựu Bộ trưởng Quốc phòng Mark Esper đã từng làm việc văn phòng quan hệ chính phủ của Raytheon. ✱ Al Jazeera: Nhiều dự luật trong quá khứ, đã được Hạ viện và Thượng viện thông qua trong nhiều thập kỷ mà không bị thất bại. ✱ Bilderbergmeetings Co. UK: Chính quyền Biden đã coi Nga và Trung Quốc là đối tác trong thách thức đối với “trật tự thế giới”- Sự cạnh tranh toàn diện với Trung Quốc đang trở thành một nguyên tắc trong các chính sách kinh tế, đối ngoại và an ninh của Hoa Kỳ...
Tại Bangkok, Hội nghị Thượng đỉnh APEC 2022 đã kết thúc và 21 quốc gia thành viên đã đồng thuận đưa ra một Bản Tuyên bố chung với nội dung lên án Nga về cuộc chiến tranh xâm lược tại Ukraine. Tuy nhiên, Bản Tuyên bố có nêu rõ giới hạn dè dặt là nhìn chung vẫn còn có "những quan điểm và đánh giá khác nhau về tình hình và các biện pháp trừng phạt.”
Với việc ông Tập Cận Bình siết chặt kìm kẹp sắt đá đối với đảng lãnh đạo và nền kinh tế chính trị của Trung Quốc, các cuộc tranh luận dai dẳng về tính bền vững của sự tăng trưởng đáng kinh ngạc của đất nước đã trở lại nổi bật. Mô hình độc đoán của Trung Quốc, sau khi tiến xa, rốt cuộc có thể là không có gì là quá đặc biệt. Bằng chứng về sự trì trệ này cho thấy càng ngày càng tăng...
✱ CRS Congress: Tính đến ngày 14 tháng 10 năm 2022, Hoa Kỳ đã cung cấp hơn 20,3 tỷ đô la viện trợ để giúp Ukraine bảo vệ toàn vẹn lãnh thổ - Lực lượng Đặc biệt của Hoa Kỳ mở các khóa đào tạo và huấn luyện cho lực lượng đặc biệt Ukraine. ✱ Yahoo News: CIA giám sát một chương trình bí mật huấn luyện chuyên sâu ở Mỹ cho các lực lượng hoạt động đặc biệt tinh nhuệ của Ukraine và các nhân viên tình báo khác. Chương trình huấn luyện bắt đầu vào năm 2015, tại một cơ sở không được tiết lộ ở miền Nam Hoa Kỳ. ✱ DW Germany - Lực lượng Mỹ huấn luyện quân đội Ukraine tại Đức và giúp họ học sử dụng các hệ thống vũ khí tiên tiến - việc huấn luyện các lực lượng Ukraine đang diễn ra ở các khu vực khác tại châu Âu, nhưng không tiết lộ địa điểm. ✱ Al Jazeera/DIA: Sự thất bại của các lực lượng Nga trước sự đối kháng mãnh liệt của Ukraine cho thấy lực lượng của Moscow không có khả năng đạt được mục tiêu xâm lược ban đầu do TT Putin đã đề ra. ✱ White House: Chúng tôi có quyền nói chuyện trực tiếp.
Từ ngày 6 đến 18 tháng 11 năm 2022 Hội nghị Thượng đỉnh về Biến đổi Khí hậu của Liên Hiệp Quốc lần thứ 27 (Conference of the Parties, COP27) sẽ được tổ chức tại Sharm el-Sheikh, Ai Cập. Hội nghị này được Antonio Gunterres, Tổng Thư Ký Liên Hiệp Quốc khai mạc và có khoảng đại diện của 200 quốc gia và hàng chục nghìn người tham dự...
NHẬN TIN QUA EMAIL
Vui lòng nhập địa chỉ email muốn nhận.