§ Sourcing & automatisering

Lägg till en URL-lista som källa (med scraping)

Vissa sajter har inte RSS — då anger du en lista med URL:er och Ahody plockar ut artikeltexten med CSS-selectors. Lite mer jobb än RSS men funkar på fler källor.

AdminAvancerad7 min läsning

Uppdaterad idag

Inte alla sajter har RSS-flöden. Vissa kommun-hemsidor, mindre tidningar, eller specifika sektioner saknar feed helt. Då använder du URL-lista som källa — du anger antingen specifika URL:er eller en pattern (typ "alla artiklar på /news/-sidan"), och Ahody plockar ut artikeltexten med CSS-selectors.

Detta är mer avancerat än RSS men funkar på fler källor.

§ Skärmdump Bevakningar — välj typ 'URL-lista' eller 'Webscraping'
Bevakningar — välj typ 'URL-lista' eller 'Webscraping'

  1. Identifiera måltsajten

    Sajten du vill bevaka. Två varianter:

    a) Statiska URL:er — en bestämd lista du anger manuellt:

    https://kommun.se/nyheter/2026/03/budget-godkand
    https://kommun.se/nyheter/2026/03/byggprojekt-startar
    

    b) Pattern — alla URL:er som matchar ett mönster:

    https://kommun.se/nyheter/*
    

    Då hämtar Ahody listsidan först och plockar URL:erna till artiklar därifrån.

  2. Identifiera CSS-selectors

    Du behöver veta var på sidan artikeltexten ligger. Detta är HTML-kunskap.

    Öppna en artikel på sajten i Chrome → högerklicka på rubriken → Inspect.

    Du ser HTML-koden. Hitta:

    • Rubriken — typ <h1 class="article-title">
    • Ingress — typ <p class="lede"> eller <div class="excerpt">
    • Brödtext — typ <div class="article-body">
    • Bild — typ <img class="featured-image">

    Skriv ner CSS-selectorerna (.article-title, .lede, .article-body, .featured-image).

  3. Öppna källkonfigen

    Logga in i Ahody som admin. Sidofältet → "Källor""Lägg till bevakning" → välj typ "URL-lista" eller "Webscraping".

  4. Grundinställningar

    • Namn — typ "Norrtälje kommun nyheter"
    • Prioritet — 1-10
    • Schema — hur ofta Ahody ska gå tillbaka och kolla efter nytt
  5. Variant: Statiska URL:er

    Klistra in URL-listan, en per rad, i fältet "URL:er att bevaka".

    Ahody besöker varje URL vid varje körning och hämtar innehållet.

  6. Variant: Pattern

    Ange en listsids-URL (typ https://kommun.se/nyheter/) och en URL-selector som plockar artikellänkar från listsidan (typ a.article-link).

    Ahody besöker listsidan, hämtar alla matchande länkar, och bearbetar varje länk som en separat artikel.

  7. Sätt CSS-selectors

    I sektionen "Extraktion" anger du selectors för:

    • Titel-selector — typ h1.article-title
    • Ingress-selector — typ p.lede
    • Brödtext-selector — typ .article-body
    • Bild-selector — typ img.featured-image (Ahody plockar src-attributet)
    • Datum-selector — typ time.published
    • Författare-selector — typ .author-name
  8. Testa extraktionen

    Klicka "Testkör" (eller liknande). Ahody hämtar en URL från listan och visar dig vad selectorerna plockade ut.

    Kolla noggrant:

    • Stämmer titeln?
    • Är brödtexten ren (inga menyer, sidofält)?
    • Finns bilden?

    Är något fel — justera selectorerna och testa igen.

  9. Konfigurera AI-prompten

    Som med RSS-källor: sätt system-meddelande, user-meddelande och eventuella exempel-artiklar.

    Detaljerad guide: "Sätt prompt + system-meddelande per källa".

  10. Aktivera och övervaka

    Toggla "Aktiv". Källan börjar köras på sitt schema.

    Övervaka första dygnen:

    • Loggar för fel
    • Inkorgen för kvalitet på utdrag
    • Justera selectors om något inte stämmer

Om du fastnar

  • "Testkörningen returnerar tomma fält" — CSS-selectors hittar inga element. Verifiera i Chrome → Inspect att klassnamnen stämmer.
  • "Brödtexten innehåller meny-länkar och cookie-banners" — Selectorn är för bred. Använd mer specifik selector (typ .article-body p istället för bara .article-body).
  • "403 Forbidden eller 429 Too Many Requests" — Sajten blockerar Ahody. Sänk pollingfrekvens. Vissa sajter blockerar alla automatiserade besökare — då funkar inte scraping överhuvudtaget.
  • "Vissa artiklar plockas, andra inte" — Olika artiklar kan ha olika HTML-strukturer på samma sajt. Kontakta support@ahody.com för hjälp att bygga en robustare extraktor.