Konstruktivní technické připomínky k diskusím o sčítání otroků v ČR
Autor, jehož jméno a adresa jsou známy, si přeje setrvat v anonymitě.
Zdravim Vas,
tak jsem poslouchal diskuse (spis propagandu) ohledne scitani otroku v CR
a
duvody, proc by melo byt na formularich rodne cislo a jmeno. Pry kvuli
odstraneni duplicit. Na to by se ale (aby se minimalizovalo riziko
zneuziti) dalo pouzit IMHO hash funkci, kdy nejakou matematickou transformaci se z
informace A udela informace B ale zpet z B na A to nejde. Pouziva se to na
uchovavani (overovani) hesel - hesla nejsou v otevrene forme, ale stejne
heslo se vzdy prelozi jako stejny retezec (cislo b) a teprve pak overi.
Tak
me napadlo pred hromadnou spionazi firmy Deltax nasich formularu odtrhnout
osobni udaje (treba jeste na okresnich lokalnich uradech, kde se sbiraji
cico) a nahradit je timto hashem - cislem b. Pokud se v databazi sejdou
dva
udaje se stejnymi osobnimi daty (narozeni, rc. jmeno) tak budou mit po
prevodu hashovaci funkci stejny tvar - lze pak vyhodnotit i slozite vztahy
mezi jednotlivymi subjekty aniz by doslo k zneuziti. To je posledni
moznost
AFAIK jak zajistit bezpecnost.
Otazka ovsem je, jestli lidem z CSU o bezpecnost jde. Myslim ze je to
dalsi tunel, kterym si zamestnanci statnich uradu prizivuji na
spolecnosti a zneuzivaji stat. Jako informatikovi je mi jasne, ze v
pripade kompletni databaze proste nejde udrzet bezpecnost - z
pocitace se daji data zapsat na skryty harddisk, vypalit na cd (krome
toho slavneho cd v trezoru), odeslat bezdratovym mikrovlnnym datovym
spojem (a takove zarizeni se v pocitaci da slusne schovat), ale nejslabsim
mistem zabezpeceni je clovek (treba ten co si pri prevozu CD strci na
chvilku
do notebooku).
Mohlo by to pri pouziti hashu vypadat treba takhle:
echo "JAN CULIK" | md5sum
11cd62ce6a8d426ec86f863d783ea40c -
echo "JAN CUDLIK" | md5sum
33d876af5f81a4c7eab9d95d9acc9f1c -
echo "JAN BULIK" | md5sum
5857542727a6808c8cffde92208ad4df -
tri texty se prelozily pomoci MD5 funkce na retezce, ktere si ani pri
nahodne zamene jednoho pismena za druhe nejsou podobne. MD5 je 16bytovy
hash, coz pro normalniho smrtelnika znamena ze obsahne 256^16 moznosti tj.
3.402823e+38 moznosti. To je cislo s 38 nulami, jakykoliv text se tedy
prelozi jako nejake nahodne cislo v prostoru cisel 3.4*10^38.
Pravdepodobnost ze tedy dva nahodne rozdilne vybrane texty budou po teto
transformaci stejne je 1 ku 3.4*10^38
pokud se transformace provede jeste nezavisle na rodnem cisle napr.
echo "001012/2311" | md5sum
600334b201cd587ea59cd9446c99dc4b -
tak dvojice 11cd62ce6a8d426ec86f863d783ea40c ("JAN CULIK")
a
600334b201cd587ea59cd9446c99dc4b ("001012/2311")
je obrazem
identif
jana culika v prostoru MD5 hashovacich funkci a z toho nikdo nedokaze zpet
dostat identitu jana culika, ale dokaze overit, jestli byl jan culik
11cd62ce6a8d426ec86f863d783ea40c /
600334b201cd587ea59cd9446c99dc4b
do databaze jiz pridan pro zjisteni duplicity. Dokonce lze zjistit, kdo je
s
11cd62ce6a8d426ec86f863d783ea40c /
600334b201cd587ea59cd9446c99dc4b
v
nejakem vztahu.
Dalsi argument pro rodna cisla byl, ze se musi zkontrolovat jestli souhlasi
datum narozeni. TO ALE MUZE ZKONTROLOVAT SCITACI KOMISAR a podle vysledku
neco na formulari zaskrtnout (podle me je to ovsem pochybene a ciste
ucelove). Navic z rodneho cisla po odebrani ctyrcisli za lomitkem lze take
poznat, jestli narozeni dle RC souhlasi s datem narozeni.
Podle me by tedy k zabezpeceni stacilo, aby se jiz u scitacich komisaru
vypocitaly hashe, programek pro windows ktery ma 2 kolonky (nebo 3) a
vypocitava 3 hashe napise kazdy trinactilety programator nedouk by mohl
dodat treba UOOU a na formulare by se pres kolonky jmeno o RC prelepily
takto
vypocitane hashe (pripadne jeste na ulici, ale ta ma myslim figurovat v
nejakych statistickych korelacich).
ALE TO SAKRA MELI VYMYSLET UREDNICI CSU POKUD JSOU KOMPETENTNI!!!! Nebo je
to dalsi levota po privatizaci, sametove revoluci, nakupu stihacek a
nespocetne dalsich ktere rozeziraji ceskou spolecnost jako
rakovina....?
Musim bohuzel konstatovat, ze Ceska spolecnost je v rozkladu a nejvetsim
nepritelem je bohuzel stat, resp. lidi kteri si ho zprivatizovali.
Jestli stoji UOOU za neco, tak by mohl zastavit (odlozit) scanovani
formularu a timto zpusobem problem vyresit. Pri soucasnem stavu ode mne
nikdo nic nedostane, protoze se domnivam ze 1) akce je zmanipulovana 2)
pozadovane informace zasahuji do soukromi i jinych lidi a poskytnutim
informaci bych se tedy mohl odpustit trestneho cinu dle jinych zakonu 3)
hrozba pokutou je natlak, a pokud jsem pod natlakem nebudu vypovidat (ani
poskytovat informace) 4) pred padesati lety bylo zneuzito informaci o
lidech
na strojich firmy IBM k likvidaci nekolika desitek milionu lidi. Dnesni
osobni pocitac ma nekolikamiliardkrat vetsi vykon a pamet a potencialne ho
lze
tedy prislusnekrat vice zneuzit. Shodou okolnosti je tento pocitac take s
IBM kompatabilni.......
P.S. tohle kolem hashu budou vedet lidi na MFF UK a urcite budou mit treba
i
jinou funkci, ktera transformuje text do prostoru, kde dva ruzne texty
nemohou mit stejny obraz. Ale pokud vim tak takovy hash by musel byt
alespon
stejne dlouhy jako text....
P.P.S. Muze mi nekdo z podnikatelu podnikajicich v prislusnem oboru
napsat,
jak ma vypadat trezor na bezmala dve miliardy korun (to bude stat scitani
resp. tedy minimalni hodnota dat) a preprava takoveho bohatstvi?
Nevyplatilo
by se treba nekomu za par milionu najmout si mensi armadu a k spatne
zabezpecenym datum se proste prostrilet? Uvazoval nekdo o tomhle
bezpecnostnim riziku ? Nebo se proste pocita s tim ze zainteresovane
strany
vedi jak se k datum dostat levneji....