Visa ett inlägg
Gammal 2012-02-12, 11:11   #14
Persa
 
Persas avatar
 
Reg.datum: jan 2011
Inlägg: 474
Sharp$: 3964

Persas fotboll - 2013/2014
Stats: 6 - 2 - 0
ROI: 158.91%
Vinstprocent: 75.00%

Standard

Att hämta ut information från webbsidor är relativt enkelt om man har lite programmeringskunskaper. Utmaningen är att filtrera och hitta mönster.

Låt oss ta ett exempel där vi vill ha lite speciell statistik som t.ex. hörnor, offsides, fouls etc. Vi använder oss av ESPN Soccernet.

Spoiler:
  1. Leta upp tabellen för ligan där det finns länkar till respektive lag:
    http://soccernet.espn.go.com/tables/...league?cc=5739
  2. Kolla källkoden och skriv nu kod som filtrerar bort allt förutom länkarna till respektive lag. Resultatet blir följande:
    http://soccernet.espn.go.com/team/_/...chester-united
    http://soccernet.espn.go.com/team/_/...anchester-city
    etc.
  3. Nu är länkarna i sig oanvändbara då dessa sidor inte innehåller informationen du vill ha. Det som dock är intressant är själva id:et och namnet som vi ska använda oss av för att hitta rätt sida.

    För Manchester United är id:et "360" och namnet "manchester-united".
    För Manchester City är id:et "382" och namnet "manchester-city".

    Den sida som innehåller alla spelade matcher (endast PL) för respektive lag har följande adress:
    http://soccernet.espn.go.com/team/fixtures/_/id/$ID/league/eng.1/$NAMN?cc=5739

    Spara undan den nya adressen med korrekt id och namn i en array.
    http://soccernet.espn.go.com/team/fi...united?cc=5739
    http://soccernet.espn.go.com/team/fi...r-city?cc=5739
    etc.
  4. Nu har vi en array som är 20 lång, det vill säga en länk för respektive lag. Hämta hem varje länk och filtrera så att endast länkar som startar med "/report/_/id/" finns kvar. Nu har du ett gäng länkar som börjar med "/report/_/id/" och slutar med ett ID. Detta ID ska läggas in i följande länk
    http://soccernet.espn.go.com/match?id=$ID&cc=5739

    För Manchester Uniteds första match (borta mot WBA) får vi:
    http://soccernet.espn.go.com/match?id=318256&cc=5739
  5. Spara undan all nödvändig data i en SQL databas och glöm inte datum och match_id från föregående punkt. Anledningen att spara match_id är att inte spara dubblicerade rader i SQL databasen. Kolla därför alltid om databasen redan har respektive match_id inlagt eller inte innan du sparar.

Senast redigerad av Persa den 2012-02-12 klockan 11:14.
Persa är inte uppkopplad   Ge poäng Svara med citat