Hôm nay,  

Máy Học Machine Learning Đoán Kết Quả World Cup 2018

19/06/201800:00:00(Xem: 2510)
Machine Learning
Nhiều nhà nghiên cứu đã thử tìm cách dự đoán kết quả của mùa World Cup 2018. Nhiều công ty đã sử dụng các nhà thống kê chuyên nghiệp để phân tích cơ sở dữ liệu để định lượng xác suất kết quả của các trận đấu. Một cách ước tính khá tốt là kết hợp những tỷ lệ cược lấy từ những người đặt cược, trong đó Brazil là đội được yêu thích nhất, với xác suất thắng World Cup là 16.6%, theo sau là Đức 12.8% và Tây Ban Nha 12.5%. Tuy nhiên, trong những năm gần đây, các nhà nghiên cứu cũng đã phát triển được những kỹ thuật máy học machine learning có khả năng làm tốt hơn nhiều so với những phương pháp thống kê thông thường.

Vậy những phương pháp đã dự đoán kết quả của World Cup 2018 như thế nào?

Một câu trả lời từ công trình nghiên cứu của Andreas Groll tại Đại học Kỹ thuật Dortmund ở Đức và các cộng sự. Nhóm đã kết hợp các công cụ máy học và các phương pháp thống kế thông thường, một phương pháp được gọi là cách tiếp cận gọi là Random Forest, để xác định được đội có khả năng cao dành được chiến thắng.

Trong vài năm trở lại đây, phương pháp Random Forest được coi là một công cụ mạnh mẽ, có khả năng phân tích những tập dữ liệu lớn, đồng thời tránh được cạm bẫy của các phương pháp khai thác dữ liệu khác. Random Forest dựa trên nguyên lý rằng những sự kiện xảy ra trong tương lai có thể được quyết định bởi một biểu đồ quyết định hình cây, nơi kết quả sẽ được tính toán tại mỗi nhánh bằng cách tham chiếu đến tập huấn luyện.

Tuy nhiên, cây quyết định decision trees có một vấn đề phổ biến. Trong những giai đoạn sau của quá trình phân nhánh, các quyết định có thể bị bóp méo nghiêm trọng, bởi tập huấn luyện rất thưa thớt và dễ có biến đổi lớn, một vấn đề được gọi là mô hình quá khớp overfitting.

Cách tiếp cận Random Forest lại khác một chút. Thay vì phải tính kết quả tại mỗi nhánh, quá trình tính kết quả ở những nhánh ngẫu nhiên. Và công đoạn được làm nhiều lần, mỗi lần với một tập gồm nhiều nhánh được chọn ngẫu nhiên. Kết quả cuối cùng là trung bình của tất cả những cây quyết định decision trees. Cách tiếp cận mới có những lợi thế đáng kể. Đầu tiên, nó không gặp phải vấn đề mô hình quá khớp như trong những cây quyết định decision trees thông thường. Nó cũng cho thấy yếu tố nào là quan trọng nhất trong việc xác định kết quả.

Vì thế, nếu một cây quyết định decision tree có chứa nhiều tham số, có thể dễ dàng thấy được tham số nào có ảnh hưởng lớn nhất đến kết quả. Sau đó, những yếu tố ít quan trọng hơn có thể sẽ bị bỏ qua trong tương lai.

Groll và cộng sự đã sử dụng cách tiếp cận để mô phỏng World Cup 2018. Nhóm đã mô hình hoá kết quả của mỗi trận đấu và sử dụng các kết quả để dựng lên một giải đấu có xác suất xảy ra cao nhất.

Nhóm bắt đầu với một loạt cấc yếu tố tiềm năng mà có thể được sử dụng để xác định kết quả. Các yếu tố bao gồm các yếu tố kinh tế như GDP hay dân số của quốc gia, xếp hạng FIFA của đội tuyển quốc gia, tài sản của từng đội, cũng như độ tuổi trung bình, số cầu thủ Champions League mà họ có, hay liệu họ có lợi thế chủ nhà hay không,...

Thậm chí, cách tiếp cận Random Forest còn cho phép sử dụng cả những thứ hạng mà những người đặt cược sử dụng. Nhóm nghiên cứu sẽ sử dụng những thông tin trong mô hình và có được những thông tin chi tiết khá thú vị. Chẳng hạn như, những yếu tố có ảnh hưởng nhiều nhất là thông tin về các thứ hạng như thứ hạng FIFA, thứ hạng của những tay đặt cược,...

Những yếu tố quan trọng khác bao gồm GDP và số cầu thủ Champions League trong đội của các nước. Những yếu tố không quan trọng bao gồm dân số của quốc gia, quốc tịch của huấn luyện viên,... Và, phương pháp Random Forest đã chọn Tây Ban Nha là đội có khả năng chiến thắng cao nhất, với xác suất là 17.8%.

Tuy nhiên, yếu tố quan trọng trong dự đoán là cấu trúc của giải đấu. Nếu Đức vượt qua được vòng loại nhóm, có nhiều khả năng là họ sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội.Vì vậy phương pháp Random Forest đã ước tính cơ hội để Đức đạt được vào vòng tứ kết là 58%. Trái lại, Tây Ban Nha có ít khả năng sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội, vì thế họ có 73% cơ hội được đi vào vòng tứ kết.

Nếu cả hai đội Đức và Tây Ban Nha cùng đi vào vòng tứ kết, tỷ lệ chiến thắng của họ là gần bằng nhau. Nhóm nghiên cứu cho rằng: “Tây Ban nha được ưu ái hơn một chút so với Đức vì Đức có khả năng khá cao là sẽ bị loại trong vòng chọi 16 đội”

Tuy nhiên, có một điều bất ngờ khác: Quá trình cây ngẫu nhiên decision trees có thể mô phỏng toàn bộ giải đấu, và quá trình đã đưa ra một kết quả hoàn toàn khác. Nhóm nghiên cứu đã mô phỏng toàn bộ giải đấu 100,000 lần. Kết quả cho thấy: “Theo như mô phỏng giải đấu có khả năng xảy ra cao nhất, thay vì Tây Ban Nha, Đức mới là đội sẽ thắng World Cup”. Dù vậy, do số lượng hoán vị rất lớn của giải đấu, khả năng vẫn có thể rất khó xảy ra, ước tính khả năng xảy ra trường hợp Đức vô địch là 1/100,000. Nhìn chung, vào đầu giải đấu, Tây Ban Nha có khả năng chiến thắng cao, nhưng nếu Đức có thể vào được vòng tứ kết, họ sẽ có khả năng chiến thắng cao hơn.

Nguoivietphone.com.

Gửi ý kiến của bạn
Vui lòng nhập tiếng Việt có dấu. Cách gõ tiếng Việt có dấu ==> https://youtu.be/ngEjjyOByH4
Tên của bạn
Email của bạn
)
2 tổ chức túc cầu lớn nhất hành tinh là FIFA (Hiệp Hội Túc Cầu Thế Giới) và UEFA (Hiệp Hội Túc Cầu Châu Âu) vào ngày 28/02/2022 đã cấm các đội bóng Nga tham gia vào các trận đấu quốc tế quan trọng sắp tới. Điều này sẽ ảnh hưởng trực tiếp đến đội tuyển Nga tại giải World Cup sẽ diễn ra vào mùa thu năm nay tại Qatar.
Điểm báo quốc tế, Đỗ Kim Thêm tuyển dịch.
Úc phá vỡ mạng lưới gián điệp Trung Cộng định chi phối bầu cử 2022.
Trong hai tuần qua, biến thể Omicron của Covid– 19 đang làm điên đảo loài người. Tuy nhiên điều đang làm thế giới chú tâm và lo lắng là cuộc khủng hoảng Ukraina chưa biết đi về đâu. Trong tình hình đó, Nhật Ký Biển Đông ghi nhận những diễn biến quan trọng như sau:
Dựa vào nguồn tin từ các báo chí và hãng thông tấn quốc tế, tác giả Đào Văn Bình tổng hợp các thông tin đáng chú ý trên toàn cầu trong năm 2021.
Hai nhà lãnh đạo sẽ thảo luận về “một loạt các chủ đề, bao gồm cả các cam kết ngoại giao sắp tới,” nữ phát ngôn nhân của Hội đồng An ninh Quốc gia, Emily Horne cho biết trong một tuyên bố thông báo về cuộc điện đàm. Các cuộc đàm phán diễn ra khi Hoa Kỳ và các đồng minh phương Tây nhận thấy sự gia tăng ồ ạt của các lực lượng Nga dọc theo biên giới, ước tính đã tăng tới 100.000 người, và làm dấy lên lo ngại rằng Moscow đang chuẩn bị xâm lược Ukraine.
Viễn Vọng Kính quan sát trị giá 10 tỉ đô la đã lao về đích đến 1 triệu dặm (1.6 triệu kilometers), hay là xa hơn gấp 4 lần bên kia mặt trăng. Nó sẽ mất 1 tháng để tới đó và thêm 5 tháng nữa trước khi những con mắt hồng ngoại của nó sẵn sàng quét vào vũ trụ. Trước hết, tấm gương khổng lồ và tấm kính che nắng của viễn vọng kính cần mở ra; chúng được gấp lại theo kiểu origami của Nhật để vừa trong hình nón mũi hỏa tiễn. Nếu không, viễn vọng kính quan sát sẽ không thể quay ngược thời gian 13.7 tỉ năm như được dự kiến, chỉ trong 100 triệu năm kể từ khi vụ nổ Big Bang hình thành vũ trụ.
Đức Giáo Hoàng Francis hôm Thứ Bảy, 25 tháng 12 năm 2021, đã cầu nguyện cho sự kết thúc đại dịch vi khuẩn corona, sử dụng bài diễn văn Ngày Lễ Giáng Sinh của ngài để thúc giục việc chăm sóc sức khỏe cho tất cả mọi người, thuốc ngừa cho người nghèo và đối thoại để giải quyết các xung đột trên thế giới, theo Hãng Thông Tấn Mỹ AP tường thuật hôm Thứ Bảy. Giữa lúc gia tăng kỷ lục trong các trường hợp bị lây nhiễm Covid-19 tại Ý trong tuần này, chỉ vài ngàn ngừa đứng dưới mưa tại Quảng Trường Thánh Peter để nghe diễn văn Lễ Giáng Sinh gửi đi cho toàn thế giới hàng năm của Đức Giáo Hoàng Francis.
Trong bài giảng, Đức Giáo Hoàng Francis đã thúc giục tín đồ tập trung vào “sự nhỏ bé” của Chúa Jesus, và nhớ rằng Ngài sinh vào nơi nghèo khổ của thế giới này, không có ngay cả một chiếc nôi đàng hoàng. “Đó là nơi Chúa có mặt, trong sự nhỏ bé,” theo Đức Giáo Hoàng Francis giảng. “Đây là thông điệp: Chúa không vươn lên cao lớn, mà tự hạ mình xuống bé nhỏ. Sự nhỏ bé là con đường mà Ngài chọn để đến với chúng ta, để chạm vào trái tim của chúng ta, để cứu chúng ta và mang chúng ta trở lại với những gì quan trọng thực sự.”
Tòa Bạch Ốc cho biết, Tổng thống Hoa Kỳ Joe Biden đã ký ban hành đạo luật cấm nhập cảng hàng hóa từ khu vực Tân Cương của Trung Quốc vì vấn đề lao động cưỡng bức, theo trang Reuters đưa tin ngày Thứ Năm, 23 tháng 12 năm 2021. Đạo luật Ngăn chặn Lao động Cưỡng bức người Duy Ngô Nhĩ (The Uyghur Forced Labor Prevention Act) là một phần trong nỗ lực của Hoa Kỳ chống lại những hành động của chính quyền Bắc Kinh đối với cộng đồng thiểu số Hồi giáo Duy Ngô Nhĩ ở khu vực Tân Cương, mà Washington coi là tội diệt chủng.
NHẬN TIN QUA EMAIL
Vui lòng nhập địa chỉ email muốn nhận.