Hôm nay,  
Việt Báo Văn Học Nghệ Thuật
Việt Báo Văn Học Nghệ Thuật

Máy Học Machine Learning Đoán Kết Quả World Cup 2018

19/06/201800:00:00(Xem: 1649)
Machine Learning
Nhiều nhà nghiên cứu đã thử tìm cách dự đoán kết quả của mùa World Cup 2018. Nhiều công ty đã sử dụng các nhà thống kê chuyên nghiệp để phân tích cơ sở dữ liệu để định lượng xác suất kết quả của các trận đấu. Một cách ước tính khá tốt là kết hợp những tỷ lệ cược lấy từ những người đặt cược, trong đó Brazil là đội được yêu thích nhất, với xác suất thắng World Cup là 16.6%, theo sau là Đức 12.8% và Tây Ban Nha 12.5%. Tuy nhiên, trong những năm gần đây, các nhà nghiên cứu cũng đã phát triển được những kỹ thuật máy học machine learning có khả năng làm tốt hơn nhiều so với những phương pháp thống kê thông thường.

Vậy những phương pháp đã dự đoán kết quả của World Cup 2018 như thế nào?

Một câu trả lời từ công trình nghiên cứu của Andreas Groll tại Đại học Kỹ thuật Dortmund ở Đức và các cộng sự. Nhóm đã kết hợp các công cụ máy học và các phương pháp thống kế thông thường, một phương pháp được gọi là cách tiếp cận gọi là Random Forest, để xác định được đội có khả năng cao dành được chiến thắng.

Trong vài năm trở lại đây, phương pháp Random Forest được coi là một công cụ mạnh mẽ, có khả năng phân tích những tập dữ liệu lớn, đồng thời tránh được cạm bẫy của các phương pháp khai thác dữ liệu khác. Random Forest dựa trên nguyên lý rằng những sự kiện xảy ra trong tương lai có thể được quyết định bởi một biểu đồ quyết định hình cây, nơi kết quả sẽ được tính toán tại mỗi nhánh bằng cách tham chiếu đến tập huấn luyện.

Tuy nhiên, cây quyết định decision trees có một vấn đề phổ biến. Trong những giai đoạn sau của quá trình phân nhánh, các quyết định có thể bị bóp méo nghiêm trọng, bởi tập huấn luyện rất thưa thớt và dễ có biến đổi lớn, một vấn đề được gọi là mô hình quá khớp overfitting.

Cách tiếp cận Random Forest lại khác một chút. Thay vì phải tính kết quả tại mỗi nhánh, quá trình tính kết quả ở những nhánh ngẫu nhiên. Và công đoạn được làm nhiều lần, mỗi lần với một tập gồm nhiều nhánh được chọn ngẫu nhiên. Kết quả cuối cùng là trung bình của tất cả những cây quyết định decision trees. Cách tiếp cận mới có những lợi thế đáng kể. Đầu tiên, nó không gặp phải vấn đề mô hình quá khớp như trong những cây quyết định decision trees thông thường. Nó cũng cho thấy yếu tố nào là quan trọng nhất trong việc xác định kết quả.

Vì thế, nếu một cây quyết định decision tree có chứa nhiều tham số, có thể dễ dàng thấy được tham số nào có ảnh hưởng lớn nhất đến kết quả. Sau đó, những yếu tố ít quan trọng hơn có thể sẽ bị bỏ qua trong tương lai.

Groll và cộng sự đã sử dụng cách tiếp cận để mô phỏng World Cup 2018. Nhóm đã mô hình hoá kết quả của mỗi trận đấu và sử dụng các kết quả để dựng lên một giải đấu có xác suất xảy ra cao nhất.

Nhóm bắt đầu với một loạt cấc yếu tố tiềm năng mà có thể được sử dụng để xác định kết quả. Các yếu tố bao gồm các yếu tố kinh tế như GDP hay dân số của quốc gia, xếp hạng FIFA của đội tuyển quốc gia, tài sản của từng đội, cũng như độ tuổi trung bình, số cầu thủ Champions League mà họ có, hay liệu họ có lợi thế chủ nhà hay không,...

Thậm chí, cách tiếp cận Random Forest còn cho phép sử dụng cả những thứ hạng mà những người đặt cược sử dụng. Nhóm nghiên cứu sẽ sử dụng những thông tin trong mô hình và có được những thông tin chi tiết khá thú vị. Chẳng hạn như, những yếu tố có ảnh hưởng nhiều nhất là thông tin về các thứ hạng như thứ hạng FIFA, thứ hạng của những tay đặt cược,...

Những yếu tố quan trọng khác bao gồm GDP và số cầu thủ Champions League trong đội của các nước. Những yếu tố không quan trọng bao gồm dân số của quốc gia, quốc tịch của huấn luyện viên,... Và, phương pháp Random Forest đã chọn Tây Ban Nha là đội có khả năng chiến thắng cao nhất, với xác suất là 17.8%.

Tuy nhiên, yếu tố quan trọng trong dự đoán là cấu trúc của giải đấu. Nếu Đức vượt qua được vòng loại nhóm, có nhiều khả năng là họ sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội.Vì vậy phương pháp Random Forest đã ước tính cơ hội để Đức đạt được vào vòng tứ kết là 58%. Trái lại, Tây Ban Nha có ít khả năng sẽ gặp phải đối thủ mạnh trong vòng loại 16 đội, vì thế họ có 73% cơ hội được đi vào vòng tứ kết.

Nếu cả hai đội Đức và Tây Ban Nha cùng đi vào vòng tứ kết, tỷ lệ chiến thắng của họ là gần bằng nhau. Nhóm nghiên cứu cho rằng: “Tây Ban nha được ưu ái hơn một chút so với Đức vì Đức có khả năng khá cao là sẽ bị loại trong vòng chọi 16 đội”

Tuy nhiên, có một điều bất ngờ khác: Quá trình cây ngẫu nhiên decision trees có thể mô phỏng toàn bộ giải đấu, và quá trình đã đưa ra một kết quả hoàn toàn khác. Nhóm nghiên cứu đã mô phỏng toàn bộ giải đấu 100,000 lần. Kết quả cho thấy: “Theo như mô phỏng giải đấu có khả năng xảy ra cao nhất, thay vì Tây Ban Nha, Đức mới là đội sẽ thắng World Cup”. Dù vậy, do số lượng hoán vị rất lớn của giải đấu, khả năng vẫn có thể rất khó xảy ra, ước tính khả năng xảy ra trường hợp Đức vô địch là 1/100,000. Nhìn chung, vào đầu giải đấu, Tây Ban Nha có khả năng chiến thắng cao, nhưng nếu Đức có thể vào được vòng tứ kết, họ sẽ có khả năng chiến thắng cao hơn.

Nguoivietphone.com.

Gửi ý kiến của bạn
Vui lòng nhập tiếng Việt có dấu. Cách gõ tiếng Việt có dấu ==> https://youtu.be/ngEjjyOByH4
Tên của bạn
Email của bạn
Hoàn toàn ngập tràn trong cảm xúc hạnh phúc, Alexander Zverev ăn mừng thành công lớn nhất trong sự nghiệp của mình tại Thế vận hội Olympic. Alexander Zverev đã giành được Huy Chương Vàng quần vợt đơn nam tại Thế vận hội Olympic 2021- với tư cách là người Đức đầu tiên. Đó là thành công lớn nhất trong sự nghiệp của anh ấy. Khi đã đạt được mục tiêu trong mơ, Alexander Zverev khuỵu gối như thể đang quay phim chậm và nắm lấy tay trước mặt. Rồi những giọt nước mắt chiến thắng của anh trào ra.
Vì đạo tràng tu học không phải toạ lạc trên một quốc gia nào như trước đây, mà đạo tràng chỉ là khoảng không gian ảo, vì vậy không có sự sinh hoạt tập thể hằng ngày như là; Toạ Thiền - Tụng Thần Chú Lăng Nghiêm buổi sáng sớm, rồi Tảo Thực (điểm tâm), các ban Hành Đường, Trai Soạn và Vệ Sinh chấp tác, Học Pháp, Quá Đường Kinh Hành, Tụng Kinh Cầu An buổi trưa, Học Pháp và Vãn Thực (dùng chiều) rồi dạo quanh khung viên đạo tràng trước khi vào buổi học pháp cuối cùng trong ngày, rồi cùng chỉ tịnh chung trong một căn phòng từ 10 đến 20 người hoặc hơn và chính vì vậy mà mọi người được thưởng thức tiếng nhạc trong đêm khuya với đủ loại nhạc cụ và âm điệu, được phát ra từ mỗi học viên, nhưng kỳ 32 này chỉ có Học Pháp và tương tác với nhau trên màn ảnh nhỏ.
Phát biểu tại Singapore như là một phần của chuỗi Fullerton Lecture được bảo trợ bởi Viện Nghiên Cứu Chiến Lược Quốc Tế (IISS), Austin nhấn mạnh rằng Hoa Kỳ là đối tác đáng tin cậy đối với các quốc gia Đông Nam Á và nêu chi tiết về tư duy của người Mỹ về môi trường trong khu vực chiến lược này.
Ngoại Trưởng Hoa Kỳ Antony Blinken đã gặp đại diện của Đức Đạt Lai Lạt Ma tại New Delhi, Ấn Độ, hôm Thứ Tư, 28 tháng 7 năm 2021, một hành động có thể làm Bắc Kinh giận dữ vì xem nhà lãnh đạo tinh thần Tây Tạng là nhà ly khai nguy hiểm, theo bản tin của Reuters tường thuật hôm Thứ Tư.
Thiếu nữ Nishiya Momiji của Nhật Bản đã thắng môn trượt ván đường phố của phụ nữ tại Thế Vận Hội Tokyo 2020, theo CNN tường thuật hôm Thứ Hai, 26 tháng 7 năm 2021. Ở tuổi 13, cô bé hiện là một trong những người đoạt huy chương vàng trẻ nhất trong lịch sử Thế Vận Hội. Cô này chỉ già hơn 1 tháng so với bé gái giữ kỷ lục hiện nay, là tay lặn người Mỹ Marjorie Gestring, đã 13 tuổi và 267 ngày khi cô thắng huy chương vàng tại Thế Vận Hội Berlin vào năm 1936.
Hàng ngàn người đã chiếm các đường phố của Sydney và nhiều thành phố khác ở Úc hôm Thứ Bảy, 24 tháng 7 năm 2021, để chống các hạn chế phong tỏa giữa đợt gia tăng các trường hợp lây nhiễm Covid-19 khác, và cảnh sát đã bắt giữ nhiều người sau khi các đám đông phá những hàng rào cản trở và ném chai nhựa và cây cối, theo bản tin của Đài NPR tường thuật hôm Thứ Bảy.
Tuyên bố được phổ biến bởi lãnh sự quán TQ ở New York nói rằng NBC “đã làm tổn thương phẩm cách và tình cảm của người dân TQ” qua việc chiếu “bản đồ không đầy đủ” trong lúc các lực sĩ của nước này đến dự Thế Vận Hội. “Chúng tôi thúc giục NBC nhận ra bản chất nghiêm trọng của vấn đề này và thực hiện các biện pháp sửa đổi lỗi lầm,” theo tuyên bố nói trên cho biết.
Khi ông ấy tiến tới trạm kiểm soát, Pardis đã đạp ga để tăng tốc độ chạy xuyên qua. Ông đã không còn được thấy sống nữa. Những người dân làng đã chứng kiến sự kiện nói với Red Crescent là Taliban đã bắn vào xe của ông ấy trước khi nó chạy qua và dừng lại. Sau đó họ đã treo Pardis lên xe và chặt đầu ông ấy. Pardis là một trong hàng ngàn thông dịch viên người Afghanistan làm việc cho quân đội Hoa Kỳ và hiện đang đối diện sự khủng bố bởi Taliban, khi nhóm này giành lấy sự kiểm soát nhiều vùng rộng lớn hơn của đất nước này.
Tổng Thống Joe Biden đã công bố các trừng phạt mới hôm Thứ Năm, 22 tháng 7 năm 2021, nhắm vào viên chức đứng đầu quân sự Cuba và một đơn vị của bộ máy an ninh nhà nước đàn áp của chính quyền, mà ông nói là chịu trách nhiệm cho việc đàn áp tàn bạo cuộc biểu tình lịch sử khắp đảo quốc trong tháng này, theo bản tin của báo USA Today hôm Thứ Năm.
Như nhiều vùng trên thế giới đang chứng kiến sự tàn phá do hạn hán và các đợt nóng kinh hoàng vì biến đổi khí hậu, tỉnh Hà Nam của Trung Quốc, có dân số hơn 100 triệu người, đã và đang trải qua những trận mưa như trút nước và lũ lụt, theo bản tin của Buzz Feed News tường thuật hôm Thứ Tư, 21 tháng 7 năm 2021.
TIN TỨC
NHẬN TIN QUA EMAIL
Vui lòng nhập địa chỉ email muốn nhận.