Serwis Polskiego Towarzystwa Genealogicznego

flag-pol flag-eng home login logout Forum Fotoalbum Geneszukacz Parafie Geneteka Metryki Deklaracja Legiony Straty
piątek, 21 marca 2025

longpixel
longpixel

Nasi tu byli

arrow szymon3956
21:47:28 - 21.03.2025
arrow Romeczka
21:46:56 - 21.03.2025
arrow mangood
21:46:18 - 21.03.2025
arrow rkalwak
21:46:04 - 21.03.2025
arrow Sroczyński_Włodzimierz
21:45:20 - 21.03.2025
arrow ŁukaszK
21:45:10 - 21.03.2025
arrow kujawiak
21:44:23 - 21.03.2025
arrow Siemiączko_Andrzej
21:43:39 - 21.03.2025
arrow KrajewskiJerzy
21:42:42 - 21.03.2025
arrow aniemirka
21:42:36 - 21.03.2025
arrow PGorzechowski
21:41:52 - 21.03.2025
arrow sbasiacz
21:41:27 - 21.03.2025
arrow Talos
21:41:19 - 21.03.2025
arrow semux
21:41:10 - 21.03.2025
arrow Jarosław_Zapała
21:40:59 - 21.03.2025
arrow Piotrowski_Dariusz_..
21:40:27 - 21.03.2025
arrow mczarnecki2
21:40:20 - 21.03.2025
arrow Marcin_Mako
21:39:53 - 21.03.2025
arrow Pieczątkiewicz_Krzy..
21:39:12 - 21.03.2025
arrow t.dzwonkowski
21:39:04 - 21.03.2025
arrow Malrom
21:37:36 - 21.03.2025
arrow antoni_dz
21:37:14 - 21.03.2025
arrow mariakuriata
21:36:56 - 21.03.2025
arrow ewa034
21:35:47 - 21.03.2025
arrow KalDrz2005
21:35:46 - 21.03.2025
arrow qwer06
21:35:07 - 21.03.2025
arrow anetta.g
21:33:29 - 21.03.2025
arrow Dobrzyńska_Anna
21:32:10 - 21.03.2025
arrow Aleksander_Will
21:30:43 - 21.03.2025
arrow Adrian_1606
21:29:32 - 21.03.2025
Członkowie i sympatycy

Czym są indeksy i do czego służą? cz.1
Dodano: piątek, 03 maja 2024 - 13:58 Autor: GeneRys
InneUważam, że musimy sobie po raz kolejny odpowiedzieć na pytanie:
„czym indeksy genealogiczne powinny być a czym ze względów obiektywnych nie będą”.
Mam świadomość, że swoja otwartą wypowiedzią mogę zakłócić "odwieczny porządek" i "ustalone standardy" dotyczące tematu indeksowania prezentowane na forum przez uczestników PTG.
Na wstępie muszę określić swoje własne - subiektywne rozumienie indeksacji zbioru danych - widziane z perspektywy emerytowanego inżyniera IT ze sporym doświadczeniem zawodowym w przetwarzaniu masowych danych o skomplikowanych strukturach.

Wbrew temu co twierdzą - niestety liczni uczestnicy forum - podmiotem indeksowania są OSOBY znane z imienia i nazwiska a nie ponumerowane lub bez numeru akty metrykalne z zapisanymi nie zawsze poprawnymi informacjami. Tak więc pierwotną informacją tzw. kluczem poszukiwań są nazwiska, imiona, miejsca (parafie) i daty a nie nr aktów, które są dopełnieniem informacji

Osobiście jestem zwolennikiem, pełnej indeksacji tj. takie w której zwarte jest, jak najwięcej informacji bez konieczności sięgania do oryginalnego aktu niezrozumiałego dla przeciętnego użytkownika. Sam też korzystam z tych indeksów przy zachowaniu ostrożności .
Tu przy okazji muszę wspomnieć o trochę kuriozalnej formie indeksacji z jaka się spotkałem na lokalnym portalu, gdzie indeks sprowadza się do rocznika (księgi nie zdarzenia), nazwiska i imienia w danej parafii i nr aktu, jeżeli istniał (akty łacińskie niejednokrotnie go nie posiadały) co przy braku daty zdarzenia stanowi info typu: „wiem ale nie powiem 😊”
Proszę się zastanowić: czy np. znana zapewne wszystkim książka telefoniczna (obszerny indeks) jest spisem numerów czy może raczej abonentów z przypisanymi im numerami telefonów? Jeżeli w tej książce nie odnajdziemy stosownej nazwy abonenta to czy losowo wybieramy numery abonentów tu metryk?
Podobnie książka adresowa kodów pocztowych w której w 99% szukamy kodu pocztowego dla znanego adresu a nie odwrotnie. I ponownie pytam, czy jeżeli nie znajdziemy pasującej nazwy miejscowości, ulicy itd. to będzie próbować wymyślać kod pocztowy – no, chyba nie!
Czy znajdzie się choć jedna osoba, która wykaże sens by np. zamiast personaliów naszych przodków najlepiej byłoby przedstawić diagram hierarchicznie uporządkowany rocznikami i ułożonych numerami spis (indeks) aktów metrykalnych naszych przodków a zainteresowani krewni nich sobie ich poszukają sami. Już widzę zachwyt i aplauz żyjących członków rodziny, na widok tak przedstawionego diagramu rodowodu :)
Dlaczego wręcz z uporem maniakalnym próbujemy sprowadzić sen tworzenia indeksu do poszerzonego spisu aktów metrykalnych wzorem rejestru alfabetycznego na końcu każdego rocznika w księdze?
Strona << | 1 | 2 | 3 | >>


Autor Komentarze
Komentarze
SympatykSympatyk



____________
Od: Lip 02, 2006 Posty: 4643
Napisano:Maj 03, 2024 - 13:58
Skomentuj ten artykuł w tym wątku
_EZFORUMCOMMENTS_USERINFO p
bielecki
SympatykSympatyk



____________
Od: Paź 18, 2007 Posty: 557
Napisano:Maj 03, 2024 - 20:28
Tyle, że taki przez autora artykułu wyobrażony indeks nie będzie już indeksem, ale czymś w rodzaju krytycznego opracowania księgi. To byłoby nawet pożyteczne dla genealogów dzieło, jednak jego wykonanie należałoby powierzyć najtęższym głowom z naszego grona, które lata spędziły na analizie metrykaliów z danego terenu.

W rzeczywistości w ogóle nie ma na przykład czegoś takiego, jak "poprawny zapis/brzmienie nazwiska". To tylko pewien konstrukt, w który łatwo uwierzyć ludziom dzisiejszym, których personalia zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej formy. Tak kiedyś nie było, jak dobrze nam wiadomo.

Łukasz Bielecki
_EZFORUMCOMMENTS_USERINFO p
Sroczyński_Włodzimierz
Członek PTGCzłonek PTG



____________
Od: Paź 09, 2008 Posty: 34978
skąd:Warszawa
Napisano:Maj 03, 2024 - 20:43
"zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej form"
nie ma takiej definicji i nigdy nie było. To mit. Lipa. Tak jak (skutecznie!) wmawiano w 30-40 lat temu "musi być bez polskich znaków bo t komputer" - tak i np dziś polskie (narodowo) nazwisko, które przeszło drogę mp z terenów CeCeCePi, cyrylicy i ukraińskiego alfabetu do "łacińskiej pisowni" od której zęby bolą - to nie konieczność, a wybór formatu/metody. Podobnie jak kobieta "ski".
System informacyjny (a za nim informatyczny) nie musi wymuszać "jednej jedynej formy". Cyfrowy czy niecyfrowy.

Co do meritum - nie ma, Łukaszu, sporu. Indeks (także, a może przede wszystkim w IT) ma swoje znaczenie. I miał w latach 50, 60, 70 XX wieku. Zbiór indeksowany też. Jeśli zbiór jest produktem , to i tak niczego to nie zmienia. Indeksując zbiór indeksuje się zbiór:) nie to co stanowiło podstawę do jego wytworzenia. I tyle:)

No może warto dodać (też z teorii i praktyki nauk informacyjnych), że indeksów (różnych) do zbioru (niepustego o ile pamiętam) może być naprawdę naprawdę dużo.
_________________
Bez PW. Korespondencja poprzez maila:


https://genealodzy.pl/index.php?module=MailUsers&op=main&touname=Sroczy%F1ski_W%B3odzimierz
_EZFORUMCOMMENTS_USERINFO p
semux



____________
Od: Kwi 20, 2023 Posty: 9
Napisano:Maj 03, 2024 - 23:14
Wydaje mi się, że już niedługo będzie można wykorzystać możliwości modeli językowych AI do opracowywania danych.
Na dziś podstawowym problemem jest rozpoznanie tekstu, choć nie jest z tym tak źle np. https://www.transkribus.org - to jeszcze daleko do ideału.
Ale jak już będziemy mieli treść dokumentu to możemy z niego wyciągać informacje.

Tu przykład możliwości ChatGPT w wersji 3.5
Podałem mu metrykę urodzenia mojego przodka o treści
"Działo się w Piotrkowie dnia dwudziestego pierwszego stycznia tysiąc ośmset sześdziesjątego szóstego roku, o godzinie czwartej po południu stawił się Walenty Muszalski lat trzydzieści mający w obec Tomasza Ostrowskiego mularza i Mateusza Wodzińskiego wyrobnika obu z Piotrkowa po lat czterdzieści mających i okazał nam dziecię płci męskiej urodzone w Piotrkowie dnia oszegdajszego o godzinie piątej w Wieczór, z jego małżonki Julianny z Piotrowskich lat trzydzieści jeden mającej Dziecięciu temu na Chrzcie Św. dziś uroczyście odbytym nadane zostało imię Antoni Walenty a Rodzicami jego Chrzestnemi byli: Tomasz Ostrowski i Agnieszka Krzeminska. Akt ten stawającemu i swiadkom przeczytany, a że pisać nie umieją przez nas tylko podpisany został."

I zadawałem pytania:
P: Czy ten tekst jest metryką ślubu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką zgonu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką urodzenia? Odpowiedz tak lub nie.
O: Tak.

P: Jakiej płci było urodzone dziecko ?
O: Urodzone dziecko było płci męskiej.

P: Podaj imiona i nazwiska rodziców
O: Rodzicami dziecka byli Walenty Muszalski i Julianna Muszalska z domu Piotrowska.

P: Podaj imiona i nazwiska świadków
O: Świadkami byli Tomasz Ostrowski i Mateusz Wodziński.

P: W jakim dniu urodziło się dziecko
O: Dziecko urodziło się „dnia oszegdajszego o godzinie piątej w Wieczór”. Tekst wydaje się zawierać literówkę lub błąd w przepisywaniu; prawdopodobnie miało być napisane "dzisiejszego", co oznaczałoby, że dziecko urodziło się tego samego dnia, co zarejestrowano akt urodzenia, czyli 21 stycznia 1866 roku.

P: W jakim dniu urodziło się dziecko ? Podaj datę w formacie YYYY-MM-DD
O: Dziecko urodziło się 1866-01-21.

P: Podaj wszystkie imiona dziecka i ustal jego nazwisko. Podaj tylko imiona i nazwisko.
O: Imiona: Antoni Walenty, Nazwisko: Muszalski

P: Podaj imiona i nazwiska rodziców chrzestnych
O: Imiona i nazwiska rodziców chrzestnych to Tomasz Ostrowski i Agnieszka Krzemińska.

P: Czy chrzestni lub któryś z nich był też podany jako świadek?
O: Tak, w tekście wspomniano, że Tomasz Ostrowski był jednym z rodziców chrzestnych dziecka oraz jednym ze świadków aktu, który nie potrafił pisać, więc podpisał się.

Jak widać można wyciągać wszystkie informacje Smile

Odpowiednie budowanie prompt'ów i będzie można budować bazy z danymi.
Potem wyobrażam sobie, że model nakarmiony danymi z metryk, będzie wyszukiwał pokrewieństwa, znajdował błędy, odkrywał historię zmian nazwisk itp.

Pozdrawiam
Sergiusz
_EZFORUMCOMMENTS_USERINFO p


Kliknij aby przejść do komentarzy na forum

donate.jpg
Serwis Polskiego Towarzystwa Genealogicznego zawiera forum genealogiczne i bazy danych przydatne dla genealogów © 2006-2025 Polskie Towarzystwo Genealogiczne
kontakt:
Strona wygenerowana w czasie 1.600671 sekund(y)