[elektro] Sok-sok adat txt fajlban

vajk fekete halaloszto at yahoo.co.uk
Wed Nov 17 10:14:17 CET 2010


en mindenkeppen kulonvalasztanam a termelest, es az elokeszitest. 

tehat van egy program, ami a kapott file alapjan dolgozik, es pont.

ha speci dolgot kell csinalni, akkor ahhoz egy masik file-t kell gyartani. akar 
az eredetibol. 

tehat ha sokat akarsz keresni, akkor minden egyes igenyre gyartasz egy szuro 
programot, ami megeszi a fileot, es kikopi a modositottat. amig nem globalis a 
szabalykeszlet, ehhez a szurohoz nem is kell egyszerre beolvasni memoriaba az 
egeszet. de ha globalis is (ha tobb mint 1000 kek van az egeszben, akkor a 
pirosakat hagyjuk ki),akkor is inkabb megoldanam 1-2-3 vegigolvasassal mint 
memoriaba behuzni az egeszet.

ilyen egyszeru filtereket irni textfilera pl az awk tokeletes. de irhatsz 
sajatot is. 

olyan user interface-et csinalni, ahol ok maguk definialhatnak szabalyokat, az 
nem trivialis. ha  nagyon generikus, algoritmikus a definicio nyelve, akkor 
kvazi programozni kell, amit a nem ITs ugyfel nem tud. (hiszen akkor awk-al 
megoldana maganak) ha meg valami logikai/deklarativ stilusu, mint egy sql 
lekerdezes, akkor elofordulhat hamar, hogy olyan szabalyt talal ki, amit nem 
lehet vele leirni.

talan azt csinalnam, hogy kielemeznem az eddig felmerult igenyeket, es kicsit 
altalanositva, valami grafikus UI-on sok checkbox es egyebek modon csinalnek egy 
feluletet, amin le lehet irni az igenyt. aztan belul ebbol legeneralnam az awk 
programot, es azzal megfiltereznem a fileot.

vajk



________________________________
From: fabi <fabilist at gmail.com>
To: elektro at tesla.hu
Sent: Wed, 17 November, 2010 9:32:11
Subject: [elektro] Sok-sok adat txt fajlban

Sziasztok!

Gyakorlottabb kollégáktól szeretnék tanácsot kérni!
A következő a feladat:
Van egy adatbázis, a megrendelő egy nagy txt fájlban kapja, mérete kb. 
0,5-1GB. (Mezők #-el elválasztva, rekordvég CR+LF, UTF8 kódolás).

Ebből dolgozik a gépem, eddig minden jól ment, szépen beolvasom a 
memóriába, rendezem 4 mező szerint és indulhat a termelés.

Mostanában bonyolódik a dolog, két hetente hívogatnak új igényekkel, 
pld. hogy most az adatbázisból a "kékeket" kéne kihagyni, de csak akkor 
ha 8-nál nagyobb és 20-nál kisebb az ID mező, ha így fejlődnek, jövő 
héten már azokat kell előre válogatni, amelyik nevében és ID-jében 
együtt páros számú kettes számjegy van és háromnál kevesebb "b" betű.
A példák fiktívek és hülyén hangzanak, de meglepően jól közelítik a 
valóságot :)

Eddig jól elvoltam a malloc-quickshort párossal, de úgy tűnik ennek a 
korszaknak vége, át kell térni valami korszerűbb megoldásra.

Tetszőleges, "éppen arra járó" PC-n kell futnia a dolognak, telepítés 
nélkül bedugják a pendrive-ot, rajta az exe és az adatbázis, tehát egy 
telepített adatbázis kezelő nem játszik.
Milyen rendszert érdemes használni, hogy egy felhasználói szinten nem 
rosszul képzett, de nem programozó kezelő is elboldoguljon hasonló 
feladatokkal. Szerintem például SQL lekérdezéseket néhány minta alapján 
meg tudna írni.
A gépeken általában WinXP-SP2, vagy PosReady 2009 fut, nincs swap, írni 
csak a pendrive-ra lehet, de min. 2GB memória van).

Gondoltam általános megoldás lenne, hogy használat előtt beimportálja 
egy excel-be, rendezgeti, majd export. Kevesebb adattal működött is, de 
ekkora adatmennyiséggel egy klikkelés után is 20-30 percet homokórázik 
az excel.

Létezik erre a feladatra valami barátságos technológia?

üdv,
fabi


-----------------------------------------
          elektro[-flame|-etc]



      


More information about the Elektro mailing list