Serwis Polskiego Towarzystwa Genealogicznego

flag-pol flag-eng home login logout Forum Fotoalbum Geneszukacz Parafie Geneteka Metryki Deklaracja Legiony Straty
piątek, 10 stycznia 2025

longpixel


Napisz nowy temat   Odpowiedz do tematu
Zobacz poprzedni temat Wersja gotowa do druku Zaloguj się, by sprawdzić wiadomości Zobacz następny temat
Autor Wiadomość
hospesOffline
Temat postu:   PostWysłany: 07-01-2025 - 16:18
Sympatyk


Dołączył: 18-06-2021
Posty: 57

Status: Offline
Paweł, nie istnieją jeszcze takie narzędzia, które pomogłyby w tym zadaniu. Ja dziwie się tu niektórych optymizmem i deklaracjami jakoby AI było niezmiernie pomocnym instrumentem w genealogii. Jedni lubią chwalić się tysiącami osób w "swoich" drzewach, inni podkreślają swoje "szlacheckie" pochodzenie, a jak widać jeszcze inni zachwalają AI w genealogii.

_________________
Kamil
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
MrTomiQOffline
Temat postu:   PostWysłany: 07-01-2025 - 17:24
Sympatyk


Dołączył: 23-06-2022
Posty: 232

Status: Offline
hospes napisał:
Paweł, nie istnieją jeszcze takie narzędzia, które pomogłyby w tym zadaniu. Ja dziwie się tu niektórych optymizmem i deklaracjami jakoby AI było niezmiernie pomocnym instrumentem w genealogii. Jedni lubią chwalić się tysiącami osób w "swoich" drzewach, inni podkreślają swoje "szlacheckie" pochodzenie, a jak widać jeszcze inni zachwalają AI w genealogii.


Nie istnieją takie narzędzia, ale jest projekt indeksacji za pomocą AI udostępniony nawet na tym forum. Także nie wiem, jak jest taki projekt na forum, a według niektórych "nie istnieją jeszcze takie narzędzia".
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
hospesOffline
Temat postu:   PostWysłany: 07-01-2025 - 18:04
Sympatyk


Dołączył: 18-06-2021
Posty: 57

Status: Offline
W takim razie trzymam kciuki i czekam na efekty Smile

_________________
Kamil
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Kamil0123Offline
Temat postu:   PostWysłany: 07-01-2025 - 18:06
Sympatyk


Dołączył: 30-08-2024
Posty: 63

Status: Offline
Nie od niektórych ..............................................ale nie ma narzędzi do transkrypcji metryk z polskimi literami .
Na stronie MOrmonów możesz znaleźć projekt transkrypcji polskich metryk metodami AI .
Użyto słynnego programu Poczty USA do rozpoznawania tekstu listów.
I kicha .
Projekt obejmował 50 polskich parafii.
Opublikowano tę indekasację .
Niestety całkowita porażka.

Piszę o tym drugi raz .
A ty swoje .

Przyjęto w transkrypcji literę ą jako AA
Literę ę jako EE
literę ł jako LL

Jeszcze w samej transkrypcji nie tak źle

Ale w indeksacji całkowita porażka .

co ci po nazwisku .......na....
albo J........a ?????

Możesz obejrzeć wyniki .
Łatwo znaleźć .

Za dużo czytasz bajek w internecie .

Pozdrawiam

Kamil

Program do indeksacji to oparty na algorytmach genetycznych.


Ostatnio zmieniony przez Kamil0123 dnia 07-01-2025 - 18:22, w całości zmieniany 1 raz
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
MrTomiQOffline
Temat postu:   PostWysłany: 07-01-2025 - 18:21
Sympatyk


Dołączył: 23-06-2022
Posty: 232

Status: Offline
Kamil0123 napisał:
Nie od niektórych ..............................................ale nie ma narzędzi do transkrypcji metryk z polskimi literami .
Na stronie MOrmonów możesz znaleźć projekt transkrypcji polskich metryk metodami AI .
Użyto słynnego programu Poczty USA do rozpoznawania tekstu listów.
I kicha .
Projekt obejmował 50 polskich parafii.
Opublikowano tę indekasację .
Niestety całkowita porażka.

Piszę o tym drugi raz .
A ty swoje .

Przyjęto w transkrypcji literę ą jako AA
Literę ę jako EE
literę ł jako LL

Jeszcze w samej transkrypcji nie tak źle

Ale w indeksacji całkowiata porażka .

co ci po nazwisku .......na....
albo J........a ?????

Możesz obejrzeć wyniki .
Łatwo znaleźć .

Za dużo czytasz bajek w internecie .

Pozdrawiam

Kamil

Świetnie, że znasz się lepiej, a bajek żadnych nie czytam.

Jakbyś przeczytał dokładnie to co napisałem to byłoby jeszcze lepiej, bo napisałem, że nazwiska przekręca, a imiona sczytuje zadowalająco, ale po łacinie...

Wiem, że mogę obejrzeć wyniki, bo je oglądałem nie raz.

Jeszcze raz podkreślę, że piszę o metrykach mormonów, więc nie mylić tego z notariatami.

Z notariatami jest osobny projekt też użytkownika tego forum, wystarczy zadać sobie trochę trudu i odszukać ten wątek.

Napisać do Kamila, który się tym zajmuję i wytłumaczy, jak to robi.

Jeśli chodzi o notariaty to napisałem, że jest projekt, który indeksuje właśnie źródła poza metrykalne, ale nie pisałem nic o dokładności. Proszę o dokładniejsze czytanie, bo później są takie nieporozumienia.
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Kamil0123Offline
Temat postu:   PostWysłany: 07-01-2025 - 18:26
Sympatyk


Dołączył: 30-08-2024
Posty: 63

Status: Offline
Nie ma żadnego programi do indeksacji AI

I o tym pisałem
Proszę czytać dokładnie


Są dwa światy ,i jedno słońce .
AI jak pisałem to świetne narzędzie .
Ale nie do genealogii .


Mormoni użyli programu GNT6340A opartego na algorytmach genetycznych .

Pozdrawiam

I kończę

Kamil
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
MrTomiQOffline
Temat postu:   PostWysłany: 07-01-2025 - 18:34
Sympatyk


Dołączył: 23-06-2022
Posty: 232

Status: Offline
Rozumiem, ale ja mam swoje zdanie wymieniłem 6 programów, które korzystają z AI i są pomocne w genealogii, ale nadal wszyscy tutaj piszą, że nie istnieją pomocne programy do genealogii bazujące na AI. Dodam więcej trawa jest zielona, ale to już nie w mojej kompetencji, aby przekonywać do tego innych, jeśli ktoś uważa, że trawa jest niebieska to niech tak uważa jego sprawa.

Pozdrawiam również
Tomasz
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Kamil0123Offline
Temat postu:   PostWysłany: 07-01-2025 - 18:48
Sympatyk


Dołączył: 30-08-2024
Posty: 63

Status: Offline
To ,że ktoś tak napisze ,że oparte na sztucznej inteligencji to wiara w garbate aniołki .

Na jakim algorytmie .
Ja znam wszystkie ?
Jaki , na jakiej ilości neuronów ?, na jakich algorytmach kodujących ?

Bajki,bajki,bajki

Ja mam zmywarkę z AI .
Ale to wcale nie znaczy ,że nie odróżniam bajek od prawdy.
Dzisiaj nawet deska klozetowa jest z elementami AI .

My to już zanamy.
Onego czasu wszystko było EKo .
Wporzo

Pozdrawiam

Kamil
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
MarkosOffline
Temat postu:   PostWysłany: 08-01-2025 - 17:55
Zasłużony
Sympatyk


Dołączył: 25-12-2009
Posty: 127

Status: Offline
Giemza_Karol napisał:
Na dziś można by robić automatyczną indeksację parafii - OCR z AI, które by wyciągało właściwe dane. Jest to idealne zadanie - metryki są ustrukturyzowane - te same formuły tekstu, zawody, te same imiona - jakby AI przemieliło jakąś wiejską parafię i okoliczne - to nawet te same nazwiska.
Ja dla kilku parafii wyciągałem wszystkich świadków, asystujących itp. - nadałem im wszystkim UID i dopasowałem za pomocą zdrowo-rozsądkowego algorytmu.
Wynik był obiecujący - gdzieś tak z 70% aktów urodzenia dla małych parafii wiejskich - 18 i 19 wiek - dało się dopasować z innymi aktami.

Czyli jednym klikiem mam chronologiczny szereg wydarzeń z życia hutnika szklanego - nawet gdy był w danej hucie tylko świadkiem.

Do tego AI by się nadawało nawet dziś.
Nie wszyscy pochodzą z wielkich miast.

A nawet dla miast typu Radom - dla kilku tys. metryk urodzenia rocznie (w szczycie) też by dało radę.
Można by prześledzić migracje oficjalistów dworskich, młynarzy, bednarzy, kowali, itp.


Do tego nie jest potrzebna żadne AI. No chyba, że drabinki ifów czy regexy też nazwiemy "sztuczną inteligencją" Smile

_________________
Paweł.
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
piotr_nojszewskiOffline
Temat postu:   PostWysłany: 08-01-2025 - 18:54
Zasłużony
Sympatyk


Dołączył: 21-04-2013
Posty: 1611
Skąd: Warszawa
Status: Offline
Bardzo ciekawy wątek tylko dziwny.
Po pierwsze warto jednak sobie wyjaśnić że pojęcie AI jest nieostre. I możemy dla odmiany mówić o Machine Learningu. Są różne narzędzia i różne modele.
Najpopularniejsze jest oczywiście używanie tzw Dużych Modeli Językowych LLM jako wyszukiwarek, OCR i do innych zadań, do których zupełnie nie zostały stworzone. ChatGPT i inne wynalazki działają na zasadzie prawdopodobieństwa i mają halucynacje. Stąd używanie ich do OCR, tłumaczenia a nawet zwykłego robienia indeksu itp zadań z definicji wiąże się efektami rozrywkowymi. I powoli widać już skutki.

Po drugie zadania można realizować różnie. W szczególności narzędzia do OCR a w szczególności ważnego dla genealogów HTR istnieją. Przykład europejski Transcribus

Nie jest też prawdą, że Mormoni ….
Mormoni realizują duże projekty HTR + ML na metrykach głównie hiszpańskich oraz włoskich. HTR czytało a ML odszukiwało potrzebne pola jak imiona, nazwiska, miejsca. I uzupełniało bazę. Z uwagi na poziom błędów i uczenie modeli są jednak wspierane manualnie przez rodzaj crowd wsparcia przez aplikację (w PL była niedostępna). Skala była wielomilionowa. Taki był stan jakieś 2 lata temu kiedy to oglądałem. O ile wiem nadal to realizują. Nie wiem jednak jak to dziś wygląda. Poza metrykami działali na np. na kartotekach cmentarnych z Hiszpanii. To było dość proste bo była prosta struktura jak nasze kartoteki meldunkowe.
Duży projekt HTR zrealizowano w USA przy ostatniej publikacji spisu powszechnego.
(wtrącenie: moim prywatnym zdaniem wiele modeli wykorzystujących różne formy crowd zasilania jest narażonych na radykalny spadek jakości i degenerację)

Oczywiście, że wszystkie duże firmy eksperymentują z AI a jakość tego jest różna. Bo na końcu musi być kontrola. Człowiek nie znający wcale łaciny czy rosyjskiego korzystający z LLM do tłumaczenia na polski bierze na klatę duże ryzyko, że dostanie coś bez sensu.
Polska chyba jest jedynym krajem UE, w którym żadna instytucja nie należała do projektu Transcribus. Nie będę tego komentował. Ale młodsi naukowcy go używają. Czesi mają ponoć własne dobre narzędzie.
Zdecydowanie jest w zasięgu technologii i indeksacja i automatyczne budowanie drzew.
Kwestia nakładów i czasu.
Metryki są dobre bo mają strukturę. Notariaty są gorsze, można je pewnie masowo OCRować. Gorzej z “myślącym” odczytem będzie.

Tak Polska nie jest na topie i język polski nie jest. A i w genealogii komercyjnej nie ma tak wiele kasy, żeby była na czele.
Ale poszukać hasła "Automated Content Extraction"cos się znajdzie.

_________________
pozdrawiam
Piotr
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Sroczyński_WłodzimierzOffline
Temat postu:   PostWysłany: 08-01-2025 - 19:32
Członek PTG


Dołączył: 09-10-2008
Posty: 33948
Skąd: Warszawa
Status: Offline
IMO - nie ma kategorii "notariaty".
Jest i będzie kategoria "skorowidze notarialne" "repertoria notarialne" i bardzo podobne (spisy inwentarzowe ewentualnie).
I jeśli o czymkolwiek rozmawiać to nie o interpretacji treści, a o zamianie ręcznego zapisu* standardowych formuł
numer nazwisko imię/imiona (plus ewentualnie ew. 1-2-3 wyrazy z listy maksymalnie 50 wyrażen typu "umowa" "zapis" "potw. podp." etc )

zresztą materiał w ilościach wręcz masowych jest szerokodostępny, nie ma co opisywać, należy przejrzeć



* bardziej poprawnie, oddając problem "pism (od)ręcznych"

_________________
Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Kamil0123Offline
Temat postu:   PostWysłany: 08-01-2025 - 22:11
Sympatyk


Dołączył: 30-08-2024
Posty: 63

Status: Offline
Panie Piotrze
Pozwolę sobie zaznaczyć iż to ,że Pan nie zna projektów indeksacji Mormonów to nie znaczy ,że ich nie ma .
Po prostu nie ma Pan wiedzy .

60 polskich ksiąg zindeksowano tą maszyną .
Więc jak Pa nie zna proszę napisać i szczegółowo Panu wyjaśnię co i jak aby Pan miał wiedzę .
Wszystkie wyniki transkrypcji i indeksacji są u Mormonów opublikowane i znane .
Ja znam wszystkie parafie przetwarzane tą metodą .
Więc po co taka niedorzeczność .

Druga sprawa co to znaczy nieostre .

Bardzo ostre dla tych ,którzy mają wiedzę .

Nie lepiej zapytać po prostu ?
Ja się nie znam na chorobach -to jak jestem chory pytam się lekarza .
BO on się zna .

Proszę pytać . Ja mam takie wykształcenie i chętnie co nieco wyjaśnię .
Myslę ,że to dziwna dyskusja .
Skoro nie potrzebuję Pan wiedzy -znikam.

Pozdrawiam

Kamil
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
piotr_nojszewskiOffline
Temat postu:   PostWysłany: 08-01-2025 - 23:58
Zasłużony
Sympatyk


Dołączył: 21-04-2013
Posty: 1611
Skąd: Warszawa
Status: Offline
Kamil0123 napisał:
Panie Piotrze
Pozwolę sobie zaznaczyć iż to ,że Pan nie zna projektów indeksacji Mormonów to nie znaczy ,że ich nie ma .
Kamil


Sugeruję czytac ze zrozumieniem. Zaprzeczyłem pańskiemu twierdzeniu jakoby Mormoni zakończyli aktywnosc w zakresie metod ML, HTR czy AI na 60 polskich ksiegach.
To nieprawda. Nie mam pojęcia skąd czerpie Pan swoją wiedzę. Ja, zupełnie przypadkiem od Mormonów. Polski zasób to margines. Mormoni działją głównie na aktach hiszpańskojęzycznych zresztą w typie napoleońskim, narratywnych.

Nie będę wchodził w akademicką dyskusję co do pojęć. Bo to nic nie wnosi na tym forum. Bo o ile wiem nie ma jednej definicji. Nie wnosi też bycie dumnym z nieużycia HTR czy OCR.
Uzywanie pojęc na takim poziomie ogólności powoduje, że ludzie używają ChataGPT do celów do których nie był przeznaczony.
To co jest istotne to ustalenie zakresu w jakim zastosowanie metod automatyzacji ma sens z punktu widzenia rachunku korzyści.
Przykładem może być zakres wskazany przez Włodka.

Np. mając dokumenty przetranskrybowane przez HTR można nad nimi pracowac wykosztystujac ML czy jakis model AI. Ale model trzeba nauczyć jeśli ma faktycznie działać a do tego potrzeba sporo danych.

Sugeruję najpierw zapoznac sie z tym co ludzie już użytecznego robią np. w Europie
https://readcoop.eu/success-stories/
I prosze zwrócić uwage na daty tych projektów.

Tu jest np proste narzędzie do Grundbuchów. Jeden z opisanych prostych projektów.
https://transkribus.eu/r/grundbuchblaetter/#/

_________________
pozdrawiam
Piotr


Ostatnio zmieniony przez piotr_nojszewski dnia 09-01-2025 - 00:19, w całości zmieniany 1 raz
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Kamil0123Offline
Temat postu:   PostWysłany: 09-01-2025 - 00:14
Sympatyk


Dołączył: 30-08-2024
Posty: 63

Status: Offline
Ja też pozdrawiam

Panie Piotrze .

Za dużo Pan się naczytał w Internecie .
Co za ChatyGPT.???

W Toruniu jest taki naukowiec prof Włodzisław Duch .
Niech Pan poprosi o podstawowe lekcje z elementarza a nie wypisuje .

Jest to mój ostatni wpis w tym temacie bo szkoda mojego czasu .

Sugeruję zakończyć dyskusję o niczym.

Zresztą wszystko było opisywane precyzyjnie w literaturze fachowej.
Pozdrawiam

Kamil
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
MichalWojcieszakOffline
Temat postu:   PostWysłany: 09-01-2025 - 00:29


Dołączył: 09-01-2025
Posty: 1

Status: Offline
Skoro zakończyli Panowie dyskusję, pozwolę sobie podpytać osób będących aktualnie online w innym temacie. Czy zauważyliście w ostatnich dniach braki w Genetece? Zniknęła np. bardzo ważna dla mnie parafia Brody (wlkp).
 
 Zobacz profil autora Wyślij prywatną wiadomość  
Odpowiedz z cytatem Powrót do góry
Wyświetl posty z ostatnich:     
Skocz do:  
Wszystkie czasy w strefie CET (Europa)
Napisz nowy temat   Odpowiedz do tematu
Zobacz poprzedni temat Wersja gotowa do druku Zaloguj się, by sprawdzić wiadomości Zobacz następny temat
Powered by PNphpBB2 © 2003-2006 The PNphpBB Group
Credits
donate.jpg
Serwis Polskiego Towarzystwa Genealogicznego zawiera forum genealogiczne i bazy danych przydatne dla genealogów © 2006-2025 Polskie Towarzystwo Genealogiczne
kontakt:
Strona wygenerowana w czasie 0.329176 sekund(y)