HTML Quelltext auslesen

  • ello folks!


    suche derzeit eine möglichkeit aus webseiten, welche angebote auflisten, die information automatisch auslesen und abspeichern zu lassen.


    beispiel: jobangebote auf kalaydo.de -> ich möchte am ende ein programm/code haben, welches alle angebote aus einer bestimmten stadt mit den darin enthaltenen infos (datum, jobname, arbeitszeit...) ausliest und in eine datei lokal abspeichert.


    ist sowas überhaupt für eine privatperson möglich bzw gibt es eventuell schon programme die sowas machen? atm bin ich nur in pipi sprachen wie c/c++ fit. welche sprachen wären für ein solches vorhaben nötig?


    wäre für paar tipps dankbar! :love:

  • Ich behaupte da würde einiges an Arbeit drinsteckt.. Zuviel um das mal eben zu machen. Musst halt den HTML Text auswerten für die Infos und automatisierte Navigation.


    Was ist den für dich keine pipi Sprache? ;)

  • ah ratte du alte hütte :love:


    meinste wirklich da steckt zu viel arbeit drin? vieles hat ja auf solchen seiten einen einheitlichen aufbau, sodass man eventuell ein bestimmtes muster auswerten könnte. problem ist derzeit, dass ich keine ahnung habe wie ich überhaupt an quelltext oä automatisiert drankomme um es überhaupt auf irgendeine art und weise auswerten zu können. pipi sprachen im eigentlichen sinne sinds vllt keine aber außer denen (und das auch nur mittelmäßig gut) kann ich nunmal nicht viel :D

  • was zahlst? :p


    regex + CURL (c++) soll da btw wunder wirken :)


    Wenn ich das richtig sehe muss die bei Kalaydo.de(?) eig nur die UL mit der ID "resultlist" fetchen, die entsprechenden Berufe sind dann in der list aufgeglidert mit der class resultlist_job bzw. jedes <li></li> element. sollte also nicht so schwer sein mit curl ;p


    edit: schau mal hier vorbei: http://www.c-plusplus.de/forum/262216-full


    sowie http://openbook.galileocomputi…802f98899435ecc1c087b5cee (C)

    My Steam Profile (from SteamDB)


    • Worth: 4593€ (1243€ with sales)


    • Games owned: 425


    • Games not played: 273 (64%)


    • Hours on record: 3,362.5h

    3 Mal editiert, zuletzt von julian ()

  • ich weiß ja nicht wie "offiziel" deine app sein soll, aber evtl. gibt es bei den seiten schon definierte interfaces für so etwas (json, webservice, fertige api, etc). so etwas wie bspw. amazon oder paypal anbietet.