Serwis Polskiego Towarzystwa Genealogicznego

flag-pol flag-eng home login logout Forum Fotoalbum Geneszukacz Parafie Geneteka Metryki Deklaracja Legiony Straty
piątek, 24 maja 2024

longpixel
longpixel

Nasi tu byli

arrow Tedesco
13:29:10 - 24.05.2024
arrow Szynszyl
13:28:30 - 24.05.2024
arrow Darita
13:28:25 - 24.05.2024
arrow SobczakGrzegorz
13:26:55 - 24.05.2024
arrow wszwsz
13:25:20 - 24.05.2024
arrow Kasiamotyl
13:25:00 - 24.05.2024
arrow Wiktorek312
13:20:40 - 24.05.2024
arrow Jerzy_Kazieczko
13:20:03 - 24.05.2024
arrow Bialas_Malgorzata
13:19:28 - 24.05.2024
arrow wilku1967
13:19:17 - 24.05.2024
arrow asmolenska
13:19:00 - 24.05.2024
arrow PawełJerzy
13:18:24 - 24.05.2024
arrow Bańkowski_Leszek
13:18:05 - 24.05.2024
arrow Pawłowska_Ledke_Elż..
13:17:48 - 24.05.2024
arrow panszczyk_dariusz
13:17:13 - 24.05.2024
arrow Bartosz1516
13:17:13 - 24.05.2024
arrow Jerzy_Banach
13:16:58 - 24.05.2024
arrow Łukaszuk_Ostap
13:16:18 - 24.05.2024
arrow Zofia_Brzeska
13:14:51 - 24.05.2024
arrow Giemza_Karol
13:14:21 - 24.05.2024
arrow Kosciuk_Joanna
13:13:38 - 24.05.2024
arrow mibzink
13:13:02 - 24.05.2024
arrow Wesołowski_Janusz
13:12:41 - 24.05.2024
arrow Stradowski_Jacek
13:11:04 - 24.05.2024
arrow choirek
13:10:49 - 24.05.2024
arrow badur
13:10:17 - 24.05.2024
arrow Walentek_Jan
13:09:35 - 24.05.2024
arrow Sobieraj_Wojciech
13:09:13 - 24.05.2024
arrow Jarosław_Zapała
13:08:49 - 24.05.2024
arrow teemka
13:08:10 - 24.05.2024
Członkowie i sympatycy

Czym są indeksy i do czego służą? cz.1
Dodano: piątek, 03 maja 2024 - 13:58 Autor: GeneRys
InneUważam, że musimy sobie po raz kolejny odpowiedzieć na pytanie:
„czym indeksy genealogiczne powinny być a czym ze względów obiektywnych nie będą”.
Mam świadomość, że swoja otwartą wypowiedzią mogę zakłócić "odwieczny porządek" i "ustalone standardy" dotyczące tematu indeksowania prezentowane na forum przez uczestników PTG.
Na wstępie muszę określić swoje własne - subiektywne rozumienie indeksacji zbioru danych - widziane z perspektywy emerytowanego inżyniera IT ze sporym doświadczeniem zawodowym w przetwarzaniu masowych danych o skomplikowanych strukturach.

Wbrew temu co twierdzą - niestety liczni uczestnicy forum - podmiotem indeksowania są OSOBY znane z imienia i nazwiska a nie ponumerowane lub bez numeru akty metrykalne z zapisanymi nie zawsze poprawnymi informacjami. Tak więc pierwotną informacją tzw. kluczem poszukiwań są nazwiska, imiona, miejsca (parafie) i daty a nie nr aktów, które są dopełnieniem informacji

Osobiście jestem zwolennikiem, pełnej indeksacji tj. takie w której zwarte jest, jak najwięcej informacji bez konieczności sięgania do oryginalnego aktu niezrozumiałego dla przeciętnego użytkownika. Sam też korzystam z tych indeksów przy zachowaniu ostrożności .
Tu przy okazji muszę wspomnieć o trochę kuriozalnej formie indeksacji z jaka się spotkałem na lokalnym portalu, gdzie indeks sprowadza się do rocznika (księgi nie zdarzenia), nazwiska i imienia w danej parafii i nr aktu, jeżeli istniał (akty łacińskie niejednokrotnie go nie posiadały) co przy braku daty zdarzenia stanowi info typu: „wiem ale nie powiem 😊”
Proszę się zastanowić: czy np. znana zapewne wszystkim książka telefoniczna (obszerny indeks) jest spisem numerów czy może raczej abonentów z przypisanymi im numerami telefonów? Jeżeli w tej książce nie odnajdziemy stosownej nazwy abonenta to czy losowo wybieramy numery abonentów tu metryk?
Podobnie książka adresowa kodów pocztowych w której w 99% szukamy kodu pocztowego dla znanego adresu a nie odwrotnie. I ponownie pytam, czy jeżeli nie znajdziemy pasującej nazwy miejscowości, ulicy itd. to będzie próbować wymyślać kod pocztowy – no, chyba nie!
Czy znajdzie się choć jedna osoba, która wykaże sens by np. zamiast personaliów naszych przodków najlepiej byłoby przedstawić diagram hierarchicznie uporządkowany rocznikami i ułożonych numerami spis (indeks) aktów metrykalnych naszych przodków a zainteresowani krewni nich sobie ich poszukają sami. Już widzę zachwyt i aplauz żyjących członków rodziny, na widok tak przedstawionego diagramu rodowodu :)
Dlaczego wręcz z uporem maniakalnym próbujemy sprowadzić sen tworzenia indeksu do poszerzonego spisu aktów metrykalnych wzorem rejestru alfabetycznego na końcu każdego rocznika w księdze?
Strona << | 1 | 2 | 3 | >>


Autor Komentarze
Komentarze
SympatykSympatyk



____________
Od: Lip 02, 2006 Posty: 4390
Napisano:Maj 03, 2024 - 13:58
Skomentuj ten artykuł w tym wątku
_EZFORUMCOMMENTS_USERINFO p
bielecki
SympatykSympatyk



____________
Od: Paź 18, 2007 Posty: 439
Napisano:Maj 03, 2024 - 20:28
Tyle, że taki przez autora artykułu wyobrażony indeks nie będzie już indeksem, ale czymś w rodzaju krytycznego opracowania księgi. To byłoby nawet pożyteczne dla genealogów dzieło, jednak jego wykonanie należałoby powierzyć najtęższym głowom z naszego grona, które lata spędziły na analizie metrykaliów z danego terenu.

W rzeczywistości w ogóle nie ma na przykład czegoś takiego, jak "poprawny zapis/brzmienie nazwiska". To tylko pewien konstrukt, w który łatwo uwierzyć ludziom dzisiejszym, których personalia zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej formy. Tak kiedyś nie było, jak dobrze nam wiadomo.

Łukasz Bielecki
_EZFORUMCOMMENTS_USERINFO p
Sroczyński_Włodzimierz
Członek PTGCzłonek PTG



____________
Od: Paź 09, 2008 Posty: 31964
skąd:Warszawa
Napisano:Maj 03, 2024 - 20:43
"zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej form"
nie ma takiej definicji i nigdy nie było. To mit. Lipa. Tak jak (skutecznie!) wmawiano w 30-40 lat temu "musi być bez polskich znaków bo t komputer" - tak i np dziś polskie (narodowo) nazwisko, które przeszło drogę mp z terenów CeCeCePi, cyrylicy i ukraińskiego alfabetu do "łacińskiej pisowni" od której zęby bolą - to nie konieczność, a wybór formatu/metody. Podobnie jak kobieta "ski".
System informacyjny (a za nim informatyczny) nie musi wymuszać "jednej jedynej formy". Cyfrowy czy niecyfrowy.

Co do meritum - nie ma, Łukaszu, sporu. Indeks (także, a może przede wszystkim w IT) ma swoje znaczenie. I miał w latach 50, 60, 70 XX wieku. Zbiór indeksowany też. Jeśli zbiór jest produktem , to i tak niczego to nie zmienia. Indeksując zbiór indeksuje się zbiór:) nie to co stanowiło podstawę do jego wytworzenia. I tyle:)

No może warto dodać (też z teorii i praktyki nauk informacyjnych), że indeksów (różnych) do zbioru (niepustego o ile pamiętam) może być naprawdę naprawdę dużo.
_________________
Bez PW. Korespondencja poprzez maila:


https://genealodzy.pl/index.php?module=MailUsers&op=main&touname=Sroczy%F1ski_W%B3odzimierz
_EZFORUMCOMMENTS_USERINFO p
semux



____________
Od: Kwi 20, 2023 Posty: 5
Napisano:Maj 03, 2024 - 23:14
Wydaje mi się, że już niedługo będzie można wykorzystać możliwości modeli językowych AI do opracowywania danych.
Na dziś podstawowym problemem jest rozpoznanie tekstu, choć nie jest z tym tak źle np. https://www.transkribus.org - to jeszcze daleko do ideału.
Ale jak już będziemy mieli treść dokumentu to możemy z niego wyciągać informacje.

Tu przykład możliwości ChatGPT w wersji 3.5
Podałem mu metrykę urodzenia mojego przodka o treści
"Działo się w Piotrkowie dnia dwudziestego pierwszego stycznia tysiąc ośmset sześdziesjątego szóstego roku, o godzinie czwartej po południu stawił się Walenty Muszalski lat trzydzieści mający w obec Tomasza Ostrowskiego mularza i Mateusza Wodzińskiego wyrobnika obu z Piotrkowa po lat czterdzieści mających i okazał nam dziecię płci męskiej urodzone w Piotrkowie dnia oszegdajszego o godzinie piątej w Wieczór, z jego małżonki Julianny z Piotrowskich lat trzydzieści jeden mającej Dziecięciu temu na Chrzcie Św. dziś uroczyście odbytym nadane zostało imię Antoni Walenty a Rodzicami jego Chrzestnemi byli: Tomasz Ostrowski i Agnieszka Krzeminska. Akt ten stawającemu i swiadkom przeczytany, a że pisać nie umieją przez nas tylko podpisany został."

I zadawałem pytania:
P: Czy ten tekst jest metryką ślubu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką zgonu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką urodzenia? Odpowiedz tak lub nie.
O: Tak.

P: Jakiej płci było urodzone dziecko ?
O: Urodzone dziecko było płci męskiej.

P: Podaj imiona i nazwiska rodziców
O: Rodzicami dziecka byli Walenty Muszalski i Julianna Muszalska z domu Piotrowska.

P: Podaj imiona i nazwiska świadków
O: Świadkami byli Tomasz Ostrowski i Mateusz Wodziński.

P: W jakim dniu urodziło się dziecko
O: Dziecko urodziło się „dnia oszegdajszego o godzinie piątej w Wieczór”. Tekst wydaje się zawierać literówkę lub błąd w przepisywaniu; prawdopodobnie miało być napisane "dzisiejszego", co oznaczałoby, że dziecko urodziło się tego samego dnia, co zarejestrowano akt urodzenia, czyli 21 stycznia 1866 roku.

P: W jakim dniu urodziło się dziecko ? Podaj datę w formacie YYYY-MM-DD
O: Dziecko urodziło się 1866-01-21.

P: Podaj wszystkie imiona dziecka i ustal jego nazwisko. Podaj tylko imiona i nazwisko.
O: Imiona: Antoni Walenty, Nazwisko: Muszalski

P: Podaj imiona i nazwiska rodziców chrzestnych
O: Imiona i nazwiska rodziców chrzestnych to Tomasz Ostrowski i Agnieszka Krzemińska.

P: Czy chrzestni lub któryś z nich był też podany jako świadek?
O: Tak, w tekście wspomniano, że Tomasz Ostrowski był jednym z rodziców chrzestnych dziecka oraz jednym ze świadków aktu, który nie potrafił pisać, więc podpisał się.

Jak widać można wyciągać wszystkie informacje Smile

Odpowiednie budowanie prompt'ów i będzie można budować bazy z danymi.
Potem wyobrażam sobie, że model nakarmiony danymi z metryk, będzie wyszukiwał pokrewieństwa, znajdował błędy, odkrywał historię zmian nazwisk itp.

Pozdrawiam
Sergiusz
_EZFORUMCOMMENTS_USERINFO p


Kliknij aby przejść do komentarzy na forum

donate.jpg
Serwis Polskiego Towarzystwa Genealogicznego zawiera forum genealogiczne i bazy danych przydatne dla genealogów © 2006-2024 Polskie Towarzystwo Genealogiczne
kontakt:
Strona wygenerowana w czasie 1.432047 sekund(y)