• Blogparser

    Tento prográmek umožňuje kompletní převedení obsahu blogu z blog.cz nebo sblog.cz do WordPressu. Pokud nevíte, co je WordPress, kromě oficiální stránky v angličtině si můžete přečíst třeba článek na Wikipedii.

    Program funguje tak, že projde celý obsah blogu, vytvoří seznam článků a pak tyto články jeden po druhém stáhne do vašeho počítače. Ze stažných dat vyextrahuje nejdůležitější informace (viz. dále) a vše nakonec uloží do souboru formátu WXR (pro technicky založené info zde).

    Soubor WXR pak lze již velmi snadno nahrát na libovolné stránky fungující na systému WordPress (viz např. tento návod v angličtině).

    Blogparser v současnosti podporuje:

    • blog.cz
      • v současnosti se změnila struktura stránek na blog.cz, takže import pravděpodobně nebude fungovat. na nápravě se pracuje.
      • export článku včetně rubrik, dat, komentářů
      • rozpoznání obrázků v článcích a jejich import jako příloha
    • sblog.cz
      • umožňuje export ze zálohy blogu stažené do počítače
      • export článků včetně rubrik, dat, komentářů (bohužel není dochována informace o e-mailu a webu komentujícího)
      • rozpoznání obrázků v článcích a jejich import jako příloha

    Licence

    Program je pod licencí GPL3.

    Upozornění, neručím nijak za funkčnost programu ani jakékoliv případné škody související s jeho používáním (viz. licence).

    Podpora

    Pokud přijde moje práce užitečná, prosím podpořte mě, abych mohl pokračovat ve vývoji opensource programů a pluginů pro WordPress.

    Návod na použití

    • Stáhněte a spusťte program (viz instrukce níže na této stránce).
    • V dialogovém okně vyberte SblogCzFileParser pro export ze sblog.cz anebo BlogCzParser pro export z blog.cz
    • sblog.cz:
      • archiv se zálohou blogu rozbalte (rozbalí se adresář stejného názvu, jako blog)
      • v Blogparseru zadejte
        • jako zdroj (Source) relativní cestu k tomuto adresáři (doporučuji tedy zálohu rozbalit do adresáře, ve kterém se nachází Blogparser)
        • jako cíl (Destination) relativní cestu souboru, do kterého se má uložit výstup
    • blog.cz
      • pro správnou funkci je nezbytné připojení k internetu.
      • Source = název blogu. Tedy pro http://nejaky.blog.cz napište jen “nejaky” bez uvozovek.
      • Destination = relativní cesta souboru, do kterého se má uložit výstup.
    • export spustíte tlačítkem Run
    • po dokončení naleznete na konci logu počet exportovaných článků, komentářů a příloh (obrázků) a pokud byly přeskočeny nějaké články, tak i jejich adresy.
    • import do WordPressu proveďte pomocí tohoto návodu

    Download

    • blogparser-1.0
      • poněkud nestabilní betaverze; zatím jen blog.cz
    • blogparser-1.1
      • již funkční export i sblog.cz
      • stále není zcela stabilní (není ošetřená kontrola nekorektních vstupů anebo např. řešení výpadků v síti), ale pro samotný provoz by to nemuselo vadit.
      • chyba: pro sblog nerozeznává komentáře u článků – bude opraveno v další verzi (velmi brzy)
    • blogparser-1.2
      • opraveno rozpoznávání komentářů pro sblog.cz
      • zotavení při chybě během zpracování článku
      • počítání zpracovaných článků, komentářů a příloh (pro kontrolu), výpis přeskočených článků na konci
      • drobné kosmetické úpravy
    • blogparser-1.3
      • korektní ošetření výjimek a údržba zdrojového kódu

    Blogparser je psán v programovacím jazyku Java, pro jeho spuštění musíte mít v počítači nejdříve Javu nainstalovánu – viz java.org.

    V případě jakýchkoliv dotazů nebo problémů týkajících se Blogparseru nebo WordPressu mne neváhejte kontaktovat. Zvláště vděčný budu za zpětnou vazbu a ohlašování případných chyb.

    Last updated: Březen 7, 2013 at 14:11 pm

    This post is also available in: English