[elektro] HTML website szöveg

elight elight at gmail.hu
Fri May 8 09:39:56 CEST 2015


Sziasztok,

Ha olyasmit szeretnétek,
hogy komplett gondolatokat , tartalmakat
is kinyerjen..

Mi PERL-ben írtunk hasonlót egyszer
ami egy wesite összes ajánlatát kigyűjti,
és adatbázisba rakja soronként ,
reklán és sallang mentesen.
Macerás dolog, és egy
másik website esetén mindig módosítani kellett
a sorfeldolgozást.
DE megoldható és rohadt tömör a kód!
Ezért érdemes írásközben kommentenzni,
ténylegesen  mi -mit is csinál,
mert egy hónap múlva már fogalma sincs
az embörgyereknek mit is követett el !!! :-D
Tuslajdonképpen erre jó egy szöveges mintafelismerési
rendszer, ami PHP-ben is van, de ott sokkal macerásabb
elérni a célr..
( Talán inkább a kettő ötvözete a nyerőbb ?
tehát ténylegesen a PHP kezeli az eredmény szöveges adatbázist.)
Az programok összekötése batcth fileokkal
( és az operátor manussal : ) prímám megoldható. Tehát
az értelmes mes ember is kellhet a eredmények minősítéséhez.
Ezért ne reménykedj a  két kattintásban.  )


( Na jó , tehát  ez nem kétkattintásos , de tuti,
amit a képernyőn látható arra mindig működik.. )

Ja meg ott a BigData halászat, abban is el lehet mélyülni,
de ez már azt hiszem,  hategyetem szintű valamicsoda.
Legalábbis nekem az ..

Üd István



2015-05-07 22:31 keltezéssel, Pipi írta:
> 2015.05.07. 17:17 keltezéssel, gyapo írta:
>> Kiss, you wrote:
>> KG> On 05/07/2015 04:34 PM, "János, Zakó" wrote:
>>>> Ha jól érzékelem, ez sem kétkattintásos megoldás.
>> KG> Egy árva darab kattintás sincs benne.
>> KG> Be kell gépelni a parancsot. :-)
>>
>> A kattintásos az a httrack:
>> https://www.httrack.com/page/2/en/index.html
>>
> de szerintem ezek a komplett html-t szedik le a tagokkal együtt,
>    ebből viszont kinyerni csak a szöveget, az lesz a munkás.
> Persze ha a fordítóiroda hajlandó a html fájl-t megenni akkor ok
>
>
>
>



More information about the Elektro mailing list