§ Sourcing & automatisering
Lägg till en URL-lista som källa (med scraping)
Vissa sajter har inte RSS — då anger du en lista med URL:er och Ahody plockar ut artikeltexten med CSS-selectors. Lite mer jobb än RSS men funkar på fler källor.
Uppdaterad idag
Inte alla sajter har RSS-flöden. Vissa kommun-hemsidor, mindre tidningar, eller specifika sektioner saknar feed helt. Då använder du URL-lista som källa — du anger antingen specifika URL:er eller en pattern (typ "alla artiklar på /news/-sidan"), och Ahody plockar ut artikeltexten med CSS-selectors.
Detta är mer avancerat än RSS men funkar på fler källor.
Identifiera måltsajten
Sajten du vill bevaka. Två varianter:
a) Statiska URL:er — en bestämd lista du anger manuellt:
https://kommun.se/nyheter/2026/03/budget-godkand https://kommun.se/nyheter/2026/03/byggprojekt-startarb) Pattern — alla URL:er som matchar ett mönster:
https://kommun.se/nyheter/*Då hämtar Ahody listsidan först och plockar URL:erna till artiklar därifrån.
Identifiera CSS-selectors
Du behöver veta var på sidan artikeltexten ligger. Detta är HTML-kunskap.
Öppna en artikel på sajten i Chrome → högerklicka på rubriken → Inspect.
Du ser HTML-koden. Hitta:
- Rubriken — typ
<h1 class="article-title"> - Ingress — typ
<p class="lede">eller<div class="excerpt"> - Brödtext — typ
<div class="article-body"> - Bild — typ
<img class="featured-image">
Skriv ner CSS-selectorerna (
.article-title,.lede,.article-body,.featured-image).- Rubriken — typ
Öppna källkonfigen
Logga in i Ahody som admin. Sidofältet → "Källor" → "Lägg till bevakning" → välj typ "URL-lista" eller "Webscraping".
Grundinställningar
- Namn — typ "Norrtälje kommun nyheter"
- Prioritet — 1-10
- Schema — hur ofta Ahody ska gå tillbaka och kolla efter nytt
Variant: Statiska URL:er
Klistra in URL-listan, en per rad, i fältet "URL:er att bevaka".
Ahody besöker varje URL vid varje körning och hämtar innehållet.
Variant: Pattern
Ange en listsids-URL (typ
https://kommun.se/nyheter/) och en URL-selector som plockar artikellänkar från listsidan (typa.article-link).Ahody besöker listsidan, hämtar alla matchande länkar, och bearbetar varje länk som en separat artikel.
Sätt CSS-selectors
I sektionen "Extraktion" anger du selectors för:
- Titel-selector — typ
h1.article-title - Ingress-selector — typ
p.lede - Brödtext-selector — typ
.article-body - Bild-selector — typ
img.featured-image(Ahody plockarsrc-attributet) - Datum-selector — typ
time.published - Författare-selector — typ
.author-name
- Titel-selector — typ
Testa extraktionen
Klicka "Testkör" (eller liknande). Ahody hämtar en URL från listan och visar dig vad selectorerna plockade ut.
Kolla noggrant:
- Stämmer titeln?
- Är brödtexten ren (inga menyer, sidofält)?
- Finns bilden?
Är något fel — justera selectorerna och testa igen.
Konfigurera AI-prompten
Som med RSS-källor: sätt system-meddelande, user-meddelande och eventuella exempel-artiklar.
Detaljerad guide: "Sätt prompt + system-meddelande per källa".
Aktivera och övervaka
Toggla "Aktiv". Källan börjar köras på sitt schema.
Övervaka första dygnen:
- Loggar för fel
- Inkorgen för kvalitet på utdrag
- Justera selectors om något inte stämmer
Om du fastnar
- "Testkörningen returnerar tomma fält" — CSS-selectors hittar inga element. Verifiera i Chrome → Inspect att klassnamnen stämmer.
- "Brödtexten innehåller meny-länkar och cookie-banners" — Selectorn är för bred. Använd mer specifik selector (typ
.article-body pistället för bara.article-body). - "403 Forbidden eller 429 Too Many Requests" — Sajten blockerar Ahody. Sänk pollingfrekvens. Vissa sajter blockerar alla automatiserade besökare — då funkar inte scraping överhuvudtaget.
- "Vissa artiklar plockas, andra inte" — Olika artiklar kan ha olika HTML-strukturer på samma sajt. Kontakta support@ahody.com för hjälp att bygga en robustare extraktor.