|
|
|
Autor |
Wiadomość |
Komentarze |
|
Temat postu: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 03-05-2024 - 13:58
|
|
Dołączył: 02-07-2006
Posty: 4480
Status: Offline
|
|
|
|
|
bielecki |
|
Temat postu: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 03-05-2024 - 20:28
|
|
Dołączył: 18-10-2007
Posty: 493
Status: Offline
|
|
Tyle, że taki przez autora artykułu wyobrażony indeks nie będzie już indeksem, ale czymś w rodzaju krytycznego opracowania księgi. To byłoby nawet pożyteczne dla genealogów dzieło, jednak jego wykonanie należałoby powierzyć najtęższym głowom z naszego grona, które lata spędziły na analizie metrykaliów z danego terenu.
W rzeczywistości w ogóle nie ma na przykład czegoś takiego, jak "poprawny zapis/brzmienie nazwiska". To tylko pewien konstrukt, w który łatwo uwierzyć ludziom dzisiejszym, których personalia zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej formy. Tak kiedyś nie było, jak dobrze nam wiadomo.
Łukasz Bielecki |
|
|
|
|
|
Sroczyński_Włodzimierz |
|
Temat postu:
Wysłany: 03-05-2024 - 20:43
|
|
Dołączył: 09-10-2008
Posty: 33576
Skąd: Warszawa
Status: Offline
|
|
"zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej form"
nie ma takiej definicji i nigdy nie było. To mit. Lipa. Tak jak (skutecznie!) wmawiano w 30-40 lat temu "musi być bez polskich znaków bo t komputer" - tak i np dziś polskie (narodowo) nazwisko, które przeszło drogę mp z terenów CeCeCePi, cyrylicy i ukraińskiego alfabetu do "łacińskiej pisowni" od której zęby bolą - to nie konieczność, a wybór formatu/metody. Podobnie jak kobieta "ski".
System informacyjny (a za nim informatyczny) nie musi wymuszać "jednej jedynej formy". Cyfrowy czy niecyfrowy.
Co do meritum - nie ma, Łukaszu, sporu. Indeks (także, a może przede wszystkim w IT) ma swoje znaczenie. I miał w latach 50, 60, 70 XX wieku. Zbiór indeksowany też. Jeśli zbiór jest produktem , to i tak niczego to nie zmienia. Indeksując zbiór indeksuje się zbiór:) nie to co stanowiło podstawę do jego wytworzenia. I tyle:)
No może warto dodać (też z teorii i praktyki nauk informacyjnych), że indeksów (różnych) do zbioru (niepustego o ile pamiętam) może być naprawdę naprawdę dużo. |
_________________ Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
|
|
|
|
|
semux |
|
Temat postu: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 03-05-2024 - 23:14
|
|
Dołączył: 20-04-2023
Posty: 8
Status: Offline
|
|
Wydaje mi się, że już niedługo będzie można wykorzystać możliwości modeli językowych AI do opracowywania danych.
Na dziś podstawowym problemem jest rozpoznanie tekstu, choć nie jest z tym tak źle np. https://www.transkribus.org - to jeszcze daleko do ideału.
Ale jak już będziemy mieli treść dokumentu to możemy z niego wyciągać informacje.
Tu przykład możliwości ChatGPT w wersji 3.5
Podałem mu metrykę urodzenia mojego przodka o treści
"Działo się w Piotrkowie dnia dwudziestego pierwszego stycznia tysiąc ośmset sześdziesjątego szóstego roku, o godzinie czwartej po południu stawił się Walenty Muszalski lat trzydzieści mający w obec Tomasza Ostrowskiego mularza i Mateusza Wodzińskiego wyrobnika obu z Piotrkowa po lat czterdzieści mających i okazał nam dziecię płci męskiej urodzone w Piotrkowie dnia oszegdajszego o godzinie piątej w Wieczór, z jego małżonki Julianny z Piotrowskich lat trzydzieści jeden mającej Dziecięciu temu na Chrzcie Św. dziś uroczyście odbytym nadane zostało imię Antoni Walenty a Rodzicami jego Chrzestnemi byli: Tomasz Ostrowski i Agnieszka Krzeminska. Akt ten stawającemu i swiadkom przeczytany, a że pisać nie umieją przez nas tylko podpisany został."
I zadawałem pytania:
P: Czy ten tekst jest metryką ślubu? Odpowiedz tak lub nie.
O: Nie.
P: Czy ten tekst jest metryką zgonu? Odpowiedz tak lub nie.
O: Nie.
P: Czy ten tekst jest metryką urodzenia? Odpowiedz tak lub nie.
O: Tak.
P: Jakiej płci było urodzone dziecko ?
O: Urodzone dziecko było płci męskiej.
P: Podaj imiona i nazwiska rodziców
O: Rodzicami dziecka byli Walenty Muszalski i Julianna Muszalska z domu Piotrowska.
P: Podaj imiona i nazwiska świadków
O: Świadkami byli Tomasz Ostrowski i Mateusz Wodziński.
P: W jakim dniu urodziło się dziecko
O: Dziecko urodziło się „dnia oszegdajszego o godzinie piątej w Wieczór”. Tekst wydaje się zawierać literówkę lub błąd w przepisywaniu; prawdopodobnie miało być napisane "dzisiejszego", co oznaczałoby, że dziecko urodziło się tego samego dnia, co zarejestrowano akt urodzenia, czyli 21 stycznia 1866 roku.
P: W jakim dniu urodziło się dziecko ? Podaj datę w formacie YYYY-MM-DD
O: Dziecko urodziło się 1866-01-21.
P: Podaj wszystkie imiona dziecka i ustal jego nazwisko. Podaj tylko imiona i nazwisko.
O: Imiona: Antoni Walenty, Nazwisko: Muszalski
P: Podaj imiona i nazwiska rodziców chrzestnych
O: Imiona i nazwiska rodziców chrzestnych to Tomasz Ostrowski i Agnieszka Krzemińska.
P: Czy chrzestni lub któryś z nich był też podany jako świadek?
O: Tak, w tekście wspomniano, że Tomasz Ostrowski był jednym z rodziców chrzestnych dziecka oraz jednym ze świadków aktu, który nie potrafił pisać, więc podpisał się.
Jak widać można wyciągać wszystkie informacje
Odpowiednie budowanie prompt'ów i będzie można budować bazy z danymi.
Potem wyobrażam sobie, że model nakarmiony danymi z metryk, będzie wyszukiwał pokrewieństwa, znajdował błędy, odkrywał historię zmian nazwisk itp.
Pozdrawiam
Sergiusz |
|
|
|
|
|
Sroczyński_Włodzimierz |
|
Temat postu:
Wysłany: 03-05-2024 - 23:20
|
|
Dołączył: 09-10-2008
Posty: 33576
Skąd: Warszawa
Status: Offline
|
|
onegdajszego
i być może właśnie to nieskojarzenie (obok ograniczonego sensu organizacji informacji w pytanie/odpowiedź) najlepiej ilustruje możliwość dzisiejszego wykorzystania 3.5
Co nie znaczy, że w przyszłości...
ale niekoniecznie z powodu "OpenAI (czy inny podmiot) usprawni" , może być w drugą stronę "użytkownicy uznają, że 'tak trzeba' , toż przejście z "poszukam/poczytam" na "zadam pytanie" ma miejsce od dłuższego czasu:) |
_________________ Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
|
|
|
|
|
henryk22 |
|
Temat postu:
Wysłany: 04-05-2024 - 06:35
|
|
Dołączył: 17-11-2017
Posty: 246
Status: Offline
|
|
Z mojego doświadczenia wynika, że indeksy są przydatne, w takiej postaci takie jakie są. Wielokrotnie udało mi się odnaleźć akt, który mnie interesował. Oczywiście można narzucić osobom indeksującym wysokie wymagania, obowiązek wyciągania z metryk maksimum informacji. Trzeba jednak wziąć pod uwagę fakt, że nie są to wysoko opłacani specjaliści, tylko zwyczajni woluntariusze, którym praca zajmuje czas, a pieniędzy nie przynosi, ani też do dorobku naukowego się nie zalicza. Należy im być wdzięcznym za to co robią.
Pozdrawiam
Henryk |
|
|
|
|
|
Nagórski_Bogusław |
|
Temat postu:
Wysłany: 04-05-2024 - 08:54
|
|
Dołączył: 29-12-2011
Posty: 579
Status: Offline
|
|
Witam z Krakowa !
Czy zawsze indeksy są przydatne ? Tylko wtedy jeśli wolontariusz rzetelnie ODCZYTA zapis aktu. Jeśli ma podstawową wiedzę np o pisowni polskich nazwisk. Przykładem mogą być indeksy z FS sporządzone przez wolontariuszy z poza Polski. Ja odczytuję polskie nazwiska z Wielkopolski bez trudu a indeksujący TWORZY często zupełnie niezrozumiałe konstrukcje. Z takimi indeksami to nawet Sztuczna Inteligencja sobie nie poradzi. Ciekawe, że ci sami indeksujący prawidłowo odczytują nazwiska niemieckie. My gdy mamy wątpliwości korzystamy z pomocy kolegów z Forum. Przecież niektóre zapisy mogą budzić różne wątpliwości.
Pozdrawiam
Bogusław |
|
|
|
|
|
bielecki |
|
Temat postu:
Wysłany: 04-05-2024 - 10:39
|
|
Dołączył: 18-10-2007
Posty: 493
Status: Offline
|
|
Umiejętność odczytywania pisma ręcznego jest oczywiście ważna, bo poniżej pewnego poziomu błędów indeks staje się bezużyteczny. Mój poprzedni wpis był jednak też trochę polemiką z podejściem skupiającym się nie na wiernym odczytaniu (co jest ok), ale na odgadywaniu świętego Graala niektórych genealogów, czyli niby obiektywnie "prawidłowego" zapisu nazwiska.
Nie jest to podejście właściwe i w pewnych sytuacjach przynosi więcej szkody, niż pożytku. Dlatego uważam, że oryginalny zapis nazwisk z aktu zawsze powinien się w indeksie znajdować. Nie ma oczywiście niż złego w istnieniu rubryki, do której wpisujemy nasze domysły co do tego, co poeta miał na myśli, lub jak to nazwisko wyglądałoby noszone przez dzisiejszego Polaka. Jednak domysły nie powinny zastępować faktów, a faktem jest widniejący w dokumencie zapis.
Nawiasem mówiąc nawet różne żeńskie formy nazwisk nie zawsze pozwalają na odgadnięcie formy podstawowej. Autor artykułu nawet o tym wspomina, choć właściwie przeczy to jego narracji. Użytkownik wyszukiwarki świadomy oboczności nazwisk, które bada, znacznie sprawniej je odszuka w bazie danych i ważniejsze od wymyślenia trafnej "pisowni właściwej" jest prawidłowe przepisanie do indeksu tej faktycznie zapisanej.
Natomiast większość niedostatków indeksów, zwłaszcza w zakresie pisowni nazwisk, pomaga pokonać dobrze zaprojektowana wyszukiwarka z algorytmem dobrze radzącym sobie z obocznościami pisowni i ewentualnie z typowymi mankamentami transkrypcji.
Łukasz |
|
|
|
|
|
Sroczyński_Włodzimierz |
|
Temat postu:
Wysłany: 04-05-2024 - 11:08
|
|
Dołączył: 09-10-2008
Posty: 33576
Skąd: Warszawa
Status: Offline
|
|
"Dlatego uważam, że oryginalny zapis nazwisk z aktu zawsze powinien się w indeksie znajdować."
Tak, ale nie tak mocno, nie "zawsze". Przykładowo: są treści /dokumenty pisane tylko po rosyjsku/rzadziej rusku - (upraszczając nie zawsze z polskim zapisem w nawiasie)
Nawet gdyby znalazłyby się moce (w tym chęć) na wprowadzanie grażdżankowych oryginalnych zapisów, to z uwagi na szukanie w bazie zapewne powstałby etap interpretacji, tj umożliwienie zapytania w polskim / łacińskim alfabecie.
Sprowadziłoby się do:
* są indeksy 1:1 oryginalne, nieprzetworzone czyli zapisy odwzorowane alfabetem użytym dokumencie, wytworzone znacznie większym wysiłkiem niż "polskie"
* i tak są one przerobione (tylko "automatem nie człowiekiem") by zapytanie wprowadzone polskim, współczesnym językiem odnalazło
Stąd (i z innych - w tym poruszonej kwestii błędów) wystarczy sformułowanie i realizacja postulatu "indeks jak najbardziej zbliżony do treści w dokumencie".
Jeśli jest zmiana, to nie jako działanie celowe mające zmienić na "lepszą niż w dokumencie wersję" ale "przy tym mechanizmie bliżej do dokumentu nie będzie"
I tak - wyszukiwarka w bazie powinna rozwiązać problemy odnalezienia indeksu. A konstrukcja bazy: wyszukania dokumentu.
Poza wyszukanie dokumentu z zawartością "zapytaną" nie powinno się wychodzić. Natomiast można (i może warto - korzystając z pretekstu artykułu) wrócić do rozważań ogólniejszych jak "jakie dokumenty warto bardziej / jakie mniej", "dokument ogólnie czy z wytwórcą/przechowawcą/kanałem dystrybucji" "dokument czy od razu jego fragment" etc |
_________________ Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
|
|
|
|
|
Kostkowski |
|
Temat postu: Re: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 04-05-2024 - 11:28
|
|
Dołączył: 14-10-2010
Posty: 1165
Status: Offline
|
|
semux napisał:
... Dziecko urodziło się „dnia oszegdajszego o godzinie..."
Sergiusz
"oszegdajszego" - poprawnie onegdajszego czyli przedwczoraj. |
_________________ Z najlepszymi życzeniami wszelkiej pomyślności
Władysław Edward Kostkowski
|
|
|
|
|
mwpch |
|
Temat postu: Re: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 04-05-2024 - 13:03
|
|
Dołączył: 24-09-2008
Posty: 186
Status: Offline
|
|
Witam!
Wtrącając swoje trzy grosze podrzuciłbym kwestię celowości robienia indeksów. Celem nie jest jakaś obiektywna prawda (potocznie mówiąc sobie a muzom), ale skuteczne wykorzystanie ich do poszukiwań genealogicznych. W tym sensie można używać – oczywiście na poziomie kontekstu – pojęcia „prawidłowej formy nazwiska”, jako że taką „prawidłową formą” jest nasze obecne nazwisko. Dziś mamy sytuację, że nawet brak kreski (przy a, e, o, c, czy z) tworzy „zupełnie inne” nazwisko, ale taką stałość nazwiska będą po nas dziedziczyć potomni. Natomiast wstecznie szukamy przodków niezależnie od tego, jak „się pisali” (no, ich pisano).
Moje nazwisko w ciągu trzech wieków pisano bardzo różnie, nie tylko z powodu oboczności wynikłej z „h-ch”, czy braku końcówki „ski”. Natykałem się na bardzo dalekie odstępstwa od zwykle używanej (w danym okresie) formy, a jednak nadal chodziło o moich przodków i ich rodziny. Nie ukrywam, że chętnie widziałbym w indeksach informacje korygujące nie tylko błędy, ale i nieprawidłowości.
Osoby indeksujące całe parafie na przestrzeni lat zaznajamiają się z występującymi nazwiskami, ale też z konkretnymi osobami i potrafią „przełamać” nieczytelność pisma ręcznego lub zniekształcenia wynikłe z uszkodzeń papieru. Mogą też – zajmując się sprawą – „podpowiadać” zauważone problemy, żeby późniejsi użytkownicy indeksów nie tracili czasu i sił na coś, co oni już odkryli i wyjaśnili. Sam stosowałem (w miarę możliwości) taką zasadę indeksując interesujące mnie parafie na Lubelszczyźnie, oczywiście w uwagach, do wiadomości (niczego nie narzucając w danych podstawowych). Przykładowo moja prababcia z Kowalewskich w akcie ślubu zapisana jest jako z Kowalskich – w uwagach można zamieścić „sprostowanie”.
Tak czy owak chodzi o ułatwianie poszukiwań prowadzonych właśnie na podstawie indeksów. Suche dane są czasami mylące i to w obie strony – można zignorować osoby poszukiwane, bo zostały „inaczej” wpisane (choćby w jednym akcie), za to za krewnych uważać osoby mające tylko podobne nazwisko. A wyszukiwarki nie wszystkie oboczności wyłapią. Często wiedząc, że poszukiwana osoba mieszkała w danej parafii wpisuję tylko jej imię i przeglądam nazwiska, jakie mi się pojawiły. Wiele razy byłem zdumiony, w jak dziwaczny sposób zapisywano interesujące mnie nazwiska.
Generalnie moja konstatacja jest taka, że indeksy mają służyć nie sobie samym, ale temu, żeby mogli z nich sensownie – i przede wszystkim skutecznie – korzystać genealodzy (szczególnie amatorzy, którym jest jakby trudniej).
Pozdrawiam.
Marek. |
|
|
|
|
|
bielecki |
|
Temat postu: Re: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 04-05-2024 - 13:32
|
|
Dołączył: 18-10-2007
Posty: 493
Status: Offline
|
|
Ja właśnie staram się całe życie walczyć z tym odruchowym subiektywnym przekonaniem, że możemy mówić o tym, czy zapis nazwiska w przeszłości był prawidłowy czy nie, bazując li tylko na zgodności z obecnie używanym przez potomków. Jest wiele przykładów, że to tak nie działało.
Łukasz |
|
|
|
|
|
Giemza_Karol |
|
Temat postu: Re: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 04-05-2024 - 20:36
|
|
Dołączył: 14-12-2016
Posty: 67
Status: Offline
|
|
Można wpisywać nazwisko współczesne i nazwisko oryginalne. Niestety nie ma takiej możliwości dla nazwiska panieńskiego matki.
Ja mam rodzinę, gdzie dla pierwszych 3 dzieci matka jest "Przychodnia", a dla kolejnych 3 dzieci matka jest "Surowiec".
Do tego jak jedno z tej pierwszej trójki się żeni to ma wpisaną matkę "z Surowców".
Dla mnie to na tyle oczywiste, że bym ją zindeksował jako "Surowiec" - a gdyby się dało to w "nazwisku oryginalnym" bym podał "Przychodnia".
Oczywiście gdyby jedno z tych pozostałych dwojga się żeniło w obcej parafii to w odpisach/aneksach będzie "Przychodnia" i tak będzie zapisany ślub.
Dlatego te "oczywiście błędne" też gdzies musza być zapisane i możliwe do wyszukiwania.
No ale ja jestem na 100% pewnien, że ona była "Surowiec" bo mam jej akt małżeństwa z pierwotnej parafii.
Podsumowaując - udostępnijcie mi odpowiednie kolumny, a ja zindeksuję tak, żeby wszyscy byli zadowoleni. |
|
|
|
|
|
SlawomirB |
|
Temat postu: Re: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 04-05-2024 - 22:32
|
|
Dołączył: 02-10-2020
Posty: 27
Status: Offline
|
|
Giemza_Karol napisał:
Można wpisywać nazwisko współczesne i nazwisko oryginalne. Niestety nie ma takiej możliwości dla nazwiska panieńskiego matki.
Kolumna dla nazwiska matki ma możliwość wpisania 29 znaków. Ja bym zaindeksował pierwsze nazwisko takie jak w akcie a drugie tak jak vel, czyli np. Przychodnia Surowiec. Daje to 20 znaków i można nawet zapisać tak: Przychodnia vel Surowiec - co daje 24 znaki.
Wyszukiwarka to wyszukuje a przecież o to nam chodzi.
Poza tym poruszony problem w tym temacie jest tak obszerny, że mamy kolejne "bicie piany" z którego nic nie wyniknie. Można przecież umówić się czy ustalić sztywne reguły indeksowania a i tak nie będą przestrzegane przez wszystkich, bo albo nie czytają forum, albo nie czytają regulaminów albo sobie indeksują jak im wygodniej, albo ... i tak co jakiś czas znajdzie się problem jak coś zaindeksować bo nie ma tego w "sztywnych zasadach indeksowania". I co - kto będzie te sztywne zasady co jakiś czas uzupełniał o nowe punkty?
No bo np. jak zindeksować akt zgonu, w którym zmarłej zapisano rodziców męża? Przypadkiem to odkryjemy jak nas ta zmarła zainteresuje, ale przecież nikt nie będzie sprawdzał czy dane w aktach są błędne czy poprawne.
Co zrobić jak zapisano datę urodzenia z roku 1910 np. 20 września/2 października? a mam takich przypadków bardzo dużo.
Ja wpisuję 03.10.1910 - bo domniemywam, że stary kalendarz był dla ówczesnych normalnym a ten nowy "narzuconym", i jak ktoś miał problem z dodawaniem 13 dni to mamy takie błędy.
Nie da się indeksować wszystkich danych według jakiegoś ustalonego wzorca - to jest niewykonalne.
Zawsze nas coś zaskoczy. Ale jestem za tym, by dopisywać współczesne formy imion i nazwisk a nie pozostawiać tylko takie jakie są w akcie - po to mamy kolumny vel czy uwagi. |
|
|
|
|
|
bielecki |
|
Temat postu: Re: Czym są indeksy i do czego służą? cz.1 (komentarz)
Wysłany: 04-05-2024 - 22:47
|
|
Dołączył: 18-10-2007
Posty: 493
Status: Offline
|
|
SlawomirB napisał:
Co zrobić jak zapisano datę urodzenia z roku 1910 np. 20 września/2 października? a mam takich przypadków bardzo dużo.
Ja wpisuję 03.10.1910 - bo domniemywam, że stary kalendarz był dla ówczesnych normalnym a ten nowy "narzuconym", i jak ktoś miał problem z dodawaniem 13 dni to mamy takie błędy.
Chyba było raczej na odwrót, to korzystanie ze starego stylu było w Królestwie Kongresowym narzucone i to przy odejmowaniu mógł się ktoś pomylić.
Łukasz |
|
|
|
|
|
|
|
|
|
|
|