Serwis Polskiego Towarzystwa Genealogicznego

flag-pol flag-eng home login logout Forum Fotoalbum Geneszukacz Parafie Geneteka Metryki Deklaracja Legiony Straty
sobota, 22 czerwca 2024

longpixel
longpixel

Nasi tu byli

arrow Skorek_A
7:09:32 - 22.06.2024
arrow Wojnowska_Beata
7:08:37 - 22.06.2024
arrow Marcin.Rybicki
7:07:14 - 22.06.2024
arrow Kazmierczak_Slawomir
7:04:16 - 22.06.2024
arrow bartosz82
7:01:41 - 22.06.2024
arrow Dzięgielewski
6:48:25 - 22.06.2024
arrow Karpowicz_Jarosław
6:43:12 - 22.06.2024
arrow niezapominajka18
6:41:29 - 22.06.2024
arrow hermanowski_jarosław
6:40:07 - 22.06.2024
arrow bogdas
6:39:20 - 22.06.2024
arrow Pobłocka_Elżbieta
6:34:13 - 22.06.2024
arrow ochociński_krzysztof
6:32:06 - 22.06.2024
arrow Rafal1
6:13:38 - 22.06.2024
arrow Jerzy_Kazieczko
6:12:12 - 22.06.2024
arrow Marck57
6:11:25 - 22.06.2024
arrow jrklapp
6:06:12 - 22.06.2024
arrow aschum007
6:05:44 - 22.06.2024
arrow Marek1973
6:03:24 - 22.06.2024
arrow Bea
5:50:54 - 22.06.2024
arrow mmaziarski
5:48:06 - 22.06.2024
arrow danielmmm
5:47:36 - 22.06.2024
arrow Małgorzata2005
5:32:42 - 22.06.2024
arrow puszek
5:17:37 - 22.06.2024
arrow B_Wojczyk
5:13:04 - 22.06.2024
arrow EwaSobol
4:56:49 - 22.06.2024
arrow Marcin_Dobrzyński
4:47:52 - 22.06.2024
arrow Kozera_Piotr
4:40:57 - 22.06.2024
arrow gienia
4:37:27 - 22.06.2024
arrow maria_wierczynska
4:35:19 - 22.06.2024
arrow pete.nlznr
4:26:02 - 22.06.2024
Członkowie i sympatycy

Czym są indeksy i do czego służą? cz.1
Dodano: piątek, 03 maja 2024 - 13:58 Autor: GeneRys
Inne
Z nieukrywanym zdziwieniem przyjmuję lansowaną i licznie akceptowana tezę, że indeksy mają dokładnie odzwierciedlać zawartość aktów metrykalnych z całą zawartością ewidentnych błędów i niedokładności wielokrotnie sprowadzających się do afirmowania nonsensów tworzonych przez nieodpowiedzialnych - często niedouczonych - twórców tychże aktów dla których zasady gramatyki a nawet kaligrafii były czymś abstrakcyjnym i niewątpliwym polem do wykazywania się kreatywnością piszących.
Lansowana teza, że osoba zainteresowana powinna poznać zawartość oryginalnego obcojęzycznego zapisu aktu by ustalić czy jest to interesujący ją zapis poszukiwanego przodka jest tak samo nonsensowna, jaką byłaby propozycja nauki odczytywania hieroglifów dla osób chcących zapoznać się z historia starożytnego Egiptu.
Czy w takim razie tworzone indeksy mają stanowić istotną pomoc poszukującym czy tylko stanowić dla nich coś w rodzaju rozrywki umysłowej typu: krzyżówka, rebus czy inna łamigłówka?
Jednym z argumentów takiego podejścia przez indeksujących jest to, że to zainteresowany końcowy odbiorca wiedzy czerpanej z tych indeksów powinien ocenić czy prezentowana informacja jest prawdziwa czy fałszywa. Zapewne tak - tylko co z tymi informacjami, które w wyniku błędnych zapisów i zniekształceń - pomimo różnych sztuczek programistów umożliwiających wyszukiwania "alternatywnych" nazw czy równoważnych imion nie wskażą istniej ale wadliwie zaindeksowanej informacji.
Osobiście uważam, że cała ta ogromna "mrówcza" praca środowiska woluntariuszy, którzy poprzez zdobywane doświadczenie mająca ułatwić życie poszukującym informacji genealogicznych
będzie tym efektywniejsza im dane będą bardziej przetworzone, uwspółcześnione i bez tych różnych ludowych czy regionalnych udziwnień imion i końcówek nazwisk -zwłaszcza żeńskich, takich jak
-ścionka, -ówna, -anka itp. przypisywanych nawet noworodkom. Źródłem wielu błędów są zapisy nazwisk w liczbie mnogiej lub innym przypadku niż mianownik. Takie konwersje są wielokrotnie NIEODWRACALNE do mianownika lp.
Strona << | 1 | 2 | 3 | >>


Autor Komentarze
Komentarze
SympatykSympatyk



____________
Od: Lip 02, 2006 Posty: 4407
Napisano:Maj 03, 2024 - 13:58
Skomentuj ten artykuł w tym wątku
_EZFORUMCOMMENTS_USERINFO p
bielecki
SympatykSympatyk



____________
Od: Paź 18, 2007 Posty: 465
Napisano:Maj 03, 2024 - 20:28
Tyle, że taki przez autora artykułu wyobrażony indeks nie będzie już indeksem, ale czymś w rodzaju krytycznego opracowania księgi. To byłoby nawet pożyteczne dla genealogów dzieło, jednak jego wykonanie należałoby powierzyć najtęższym głowom z naszego grona, które lata spędziły na analizie metrykaliów z danego terenu.

W rzeczywistości w ogóle nie ma na przykład czegoś takiego, jak "poprawny zapis/brzmienie nazwiska". To tylko pewien konstrukt, w który łatwo uwierzyć ludziom dzisiejszym, których personalia zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej formy. Tak kiedyś nie było, jak dobrze nam wiadomo.

Łukasz Bielecki
_EZFORUMCOMMENTS_USERINFO p
Sroczyński_Włodzimierz
Członek PTGCzłonek PTG



____________
Od: Paź 09, 2008 Posty: 32208
skąd:Warszawa
Napisano:Maj 03, 2024 - 20:43
"zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej form"
nie ma takiej definicji i nigdy nie było. To mit. Lipa. Tak jak (skutecznie!) wmawiano w 30-40 lat temu "musi być bez polskich znaków bo t komputer" - tak i np dziś polskie (narodowo) nazwisko, które przeszło drogę mp z terenów CeCeCePi, cyrylicy i ukraińskiego alfabetu do "łacińskiej pisowni" od której zęby bolą - to nie konieczność, a wybór formatu/metody. Podobnie jak kobieta "ski".
System informacyjny (a za nim informatyczny) nie musi wymuszać "jednej jedynej formy". Cyfrowy czy niecyfrowy.

Co do meritum - nie ma, Łukaszu, sporu. Indeks (także, a może przede wszystkim w IT) ma swoje znaczenie. I miał w latach 50, 60, 70 XX wieku. Zbiór indeksowany też. Jeśli zbiór jest produktem , to i tak niczego to nie zmienia. Indeksując zbiór indeksuje się zbiór:) nie to co stanowiło podstawę do jego wytworzenia. I tyle:)

No może warto dodać (też z teorii i praktyki nauk informacyjnych), że indeksów (różnych) do zbioru (niepustego o ile pamiętam) może być naprawdę naprawdę dużo.
_________________
Bez PW. Korespondencja poprzez maila:


https://genealodzy.pl/index.php?module=MailUsers&op=main&touname=Sroczy%F1ski_W%B3odzimierz
_EZFORUMCOMMENTS_USERINFO p
semux



____________
Od: Kwi 20, 2023 Posty: 5
Napisano:Maj 03, 2024 - 23:14
Wydaje mi się, że już niedługo będzie można wykorzystać możliwości modeli językowych AI do opracowywania danych.
Na dziś podstawowym problemem jest rozpoznanie tekstu, choć nie jest z tym tak źle np. https://www.transkribus.org - to jeszcze daleko do ideału.
Ale jak już będziemy mieli treść dokumentu to możemy z niego wyciągać informacje.

Tu przykład możliwości ChatGPT w wersji 3.5
Podałem mu metrykę urodzenia mojego przodka o treści
"Działo się w Piotrkowie dnia dwudziestego pierwszego stycznia tysiąc ośmset sześdziesjątego szóstego roku, o godzinie czwartej po południu stawił się Walenty Muszalski lat trzydzieści mający w obec Tomasza Ostrowskiego mularza i Mateusza Wodzińskiego wyrobnika obu z Piotrkowa po lat czterdzieści mających i okazał nam dziecię płci męskiej urodzone w Piotrkowie dnia oszegdajszego o godzinie piątej w Wieczór, z jego małżonki Julianny z Piotrowskich lat trzydzieści jeden mającej Dziecięciu temu na Chrzcie Św. dziś uroczyście odbytym nadane zostało imię Antoni Walenty a Rodzicami jego Chrzestnemi byli: Tomasz Ostrowski i Agnieszka Krzeminska. Akt ten stawającemu i swiadkom przeczytany, a że pisać nie umieją przez nas tylko podpisany został."

I zadawałem pytania:
P: Czy ten tekst jest metryką ślubu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką zgonu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką urodzenia? Odpowiedz tak lub nie.
O: Tak.

P: Jakiej płci było urodzone dziecko ?
O: Urodzone dziecko było płci męskiej.

P: Podaj imiona i nazwiska rodziców
O: Rodzicami dziecka byli Walenty Muszalski i Julianna Muszalska z domu Piotrowska.

P: Podaj imiona i nazwiska świadków
O: Świadkami byli Tomasz Ostrowski i Mateusz Wodziński.

P: W jakim dniu urodziło się dziecko
O: Dziecko urodziło się „dnia oszegdajszego o godzinie piątej w Wieczór”. Tekst wydaje się zawierać literówkę lub błąd w przepisywaniu; prawdopodobnie miało być napisane "dzisiejszego", co oznaczałoby, że dziecko urodziło się tego samego dnia, co zarejestrowano akt urodzenia, czyli 21 stycznia 1866 roku.

P: W jakim dniu urodziło się dziecko ? Podaj datę w formacie YYYY-MM-DD
O: Dziecko urodziło się 1866-01-21.

P: Podaj wszystkie imiona dziecka i ustal jego nazwisko. Podaj tylko imiona i nazwisko.
O: Imiona: Antoni Walenty, Nazwisko: Muszalski

P: Podaj imiona i nazwiska rodziców chrzestnych
O: Imiona i nazwiska rodziców chrzestnych to Tomasz Ostrowski i Agnieszka Krzemińska.

P: Czy chrzestni lub któryś z nich był też podany jako świadek?
O: Tak, w tekście wspomniano, że Tomasz Ostrowski był jednym z rodziców chrzestnych dziecka oraz jednym ze świadków aktu, który nie potrafił pisać, więc podpisał się.

Jak widać można wyciągać wszystkie informacje Smile

Odpowiednie budowanie prompt'ów i będzie można budować bazy z danymi.
Potem wyobrażam sobie, że model nakarmiony danymi z metryk, będzie wyszukiwał pokrewieństwa, znajdował błędy, odkrywał historię zmian nazwisk itp.

Pozdrawiam
Sergiusz
_EZFORUMCOMMENTS_USERINFO p


Kliknij aby przejść do komentarzy na forum

donate.jpg
Serwis Polskiego Towarzystwa Genealogicznego zawiera forum genealogiczne i bazy danych przydatne dla genealogów © 2006-2024 Polskie Towarzystwo Genealogiczne
kontakt:
Strona wygenerowana w czasie 1.189553 sekund(y)