§ Sourcing & automatisering

Lägg till en URL-lista som källa (med scraping)

Vissa sajter har inte RSS — då anger du en lista med URL:er och Ahody plockar ut artikeltexten med CSS-selectors. Lite mer jobb än RSS men funkar på fler källor.

AdminAvancerad7 min läsning

Uppdaterad maj 2026

Inte alla sajter har RSS-flöden. Vissa kommun-hemsidor, mindre tidningar, eller specifika sektioner saknar feed helt. Då använder du URL-lista som källa — du anger antingen specifika URL:er eller en pattern (typ "alla artiklar på /news/-sidan"), och Ahody plockar ut artikeltexten med CSS-selectors.

Detta är mer avancerat än RSS men funkar på fler källor.

Bevakningar — välj typ 'URL-lista' eller 'Webscraping'

1
Identifiera måltsajten
Sajten du vill bevaka. Två varianter:

a) Statiska URL:er — en bestämd lista du anger manuellt:
```
https://kommun.se/nyheter/2026/03/budget-godkand
https://kommun.se/nyheter/2026/03/byggprojekt-startar
```
b) Pattern — alla URL:er som matchar ett mönster:
```
https://kommun.se/nyheter/*
```
Då hämtar Ahody listsidan först och plockar URL:erna till artiklar därifrån.
2
Identifiera CSS-selectors
Du behöver veta var på sidan artikeltexten ligger. Detta är HTML-kunskap.

Öppna en artikel på sajten i Chrome → högerklicka på rubriken → Inspect.

Du ser HTML-koden. Hitta:
- Rubriken — typ <h1 class="article-title">
- Ingress — typ <p class="lede"> eller <div class="excerpt">
- Brödtext — typ <div class="article-body">
- Bild — typ <img class="featured-image">
Skriv ner CSS-selectorerna (.article-title, .lede, .article-body, .featured-image).
Öppna källkonfigen
Logga in i Ahody som admin. Sidofältet → "Källor" → "Lägg till bevakning" → välj typ "URL-lista" eller "Webscraping".
4
Grundinställningar
- Namn — typ "Norrtälje kommun nyheter"
- Prioritet — 1-10
- Schema — hur ofta Ahody ska gå tillbaka och kolla efter nytt
Varning
Var snäll med scraping-frekvensen. Sajter blockerar om du polrar för aggressivt. Var 30-60 minuter är god ton för kommun- och organisationswebbar.
Variant: Statiska URL:er
Klistra in URL-listan, en per rad, i fältet "URL:er att bevaka".

Ahody besöker varje URL vid varje körning och hämtar innehållet.

Bra att veta
Listan kan ändras manuellt när som helst. Lägg till nya URL:er när du upptäcker dem.
Variant: Pattern
Ange en listsids-URL (typ https://kommun.se/nyheter/) och en URL-selector som plockar artikellänkar från listsidan (typ a.article-link).

Ahody besöker listsidan, hämtar alla matchande länkar, och bearbetar varje länk som en separat artikel.
7
Sätt CSS-selectors
I sektionen "Extraktion" anger du selectors för:
- Titel-selector — typ h1.article-title
- Ingress-selector — typ p.lede
- Brödtext-selector — typ .article-body
- Bild-selector — typ img.featured-image (Ahody plockar src-attributet)
- Datum-selector — typ time.published
- Författare-selector — typ .author-name
8
Testa extraktionen
Klicka "Testkör" (eller liknande). Ahody hämtar en URL från listan och visar dig vad selectorerna plockade ut.

Kolla noggrant:
- Stämmer titeln?
- Är brödtexten ren (inga menyer, sidofält)?
- Finns bilden?
Är något fel — justera selectorerna och testa igen.
Konfigurera AI-prompten
Som med RSS-källor: sätt system-meddelande, user-meddelande och eventuella exempel-artiklar.

Detaljerad guide: "Sätt prompt + system-meddelande per källa".
10
Aktivera och övervaka
Toggla "Aktiv". Källan börjar köras på sitt schema.

Övervaka första dygnen:
- Loggar för fel
- Inkorgen för kvalitet på utdrag
- Justera selectors om något inte stämmer
Tips
Sajten kan ändra sin HTML över tid. Om utdragen plötsligt blir tomma — kolla om de ändrat klassnamnen i sidans HTML. Uppdatera selectorerna.

Om du fastnar

"Testkörningen returnerar tomma fält" — CSS-selectors hittar inga element. Verifiera i Chrome → Inspect att klassnamnen stämmer.
"Brödtexten innehåller meny-länkar och cookie-banners" — Selectorn är för bred. Använd mer specifik selector (typ .article-body p istället för bara .article-body).
"403 Forbidden eller 429 Too Many Requests" — Sajten blockerar Ahody. Sänk pollingfrekvens. Vissa sajter blockerar alla automatiserade besökare — då funkar inte scraping överhuvudtaget.
"Vissa artiklar plockas, andra inte" — Olika artiklar kan ha olika HTML-strukturer på samma sajt. Kontakta support@ahody.com för hjälp att bygga en robustare extraktor.

§ Återkoppling

Var den här guiden hjälpsam?

Identifiera måltsajten

Identifiera CSS-selectors

Öppna källkonfigen

Grundinställningar

Variant: Statiska URL:er

Variant: Pattern

Sätt CSS-selectors

Testa extraktionen

Konfigurera AI-prompten

Aktivera och övervaka