Serwis Polskiego Towarzystwa Genealogicznego

flag-pol flag-eng home login logout Forum Fotoalbum Geneszukacz Parafie Geneteka Metryki Deklaracja Legiony Straty
sobota, 22 czerwca 2024

longpixel
longpixel

Nasi tu byli

arrow klaudiamarcinek
9:27:04 - 22.06.2024
arrow obora69
9:26:44 - 22.06.2024
arrow Giemza_Karol
9:26:22 - 22.06.2024
arrow Joanna_Lewicka
9:25:45 - 22.06.2024
arrow TomekSz1
9:25:32 - 22.06.2024
arrow chołoniewski
9:22:02 - 22.06.2024
arrow Sroczyński_Włodzimierz
9:19:59 - 22.06.2024
arrow HKCiszewska
9:19:21 - 22.06.2024
arrow Więcek_Marcin
9:17:29 - 22.06.2024
arrow Roulious52
9:16:47 - 22.06.2024
arrow Wacławik_Konrad
9:16:12 - 22.06.2024
arrow piotr1966
9:11:58 - 22.06.2024
arrow sbasiacz
9:08:35 - 22.06.2024
arrow Kubalessini
9:05:14 - 22.06.2024
arrow mat_h
9:01:45 - 22.06.2024
arrow Zn_Leon
9:01:29 - 22.06.2024
arrow Rokdar
9:01:24 - 22.06.2024
arrow zenek1573
9:01:24 - 22.06.2024
arrow l.wacuawek
9:00:13 - 22.06.2024
arrow pete.nlznr
9:00:02 - 22.06.2024
arrow Lukas1212
8:58:25 - 22.06.2024
arrow JanKarJas3
8:56:22 - 22.06.2024
arrow Piotr_Kom
8:55:36 - 22.06.2024
arrow hniew
8:54:48 - 22.06.2024
arrow Małgorzata_Kulwieć
8:54:38 - 22.06.2024
arrow cypla_piotr
8:54:06 - 22.06.2024
arrow andrzej_z
8:51:24 - 22.06.2024
arrow liverpoolczyk02
8:51:21 - 22.06.2024
arrow Rebell_Cieniewska_Grażyna
8:49:28 - 22.06.2024
arrow david77777
8:49:13 - 22.06.2024
Członkowie i sympatycy

Czym są indeksy i do czego służą? cz.1
Dodano: piątek, 03 maja 2024 - 13:58 Autor: GeneRys
Inne
Osoby zainteresowane indeksami to osoby znające współczesne nazwiska i imiona przodków zarówno z opowiadań krewnych jak i choćby napisów na nagrobkach – zaś „starodawne” nazwiska czy imiona przodków są im obce a więc prezentowanie ich w indeksach nie jest pomocne.
Uczymy się języków obcych ale czy w takim razie należy zaprzestać tłumaczenia książek na j.p.
Przecież nawet wiele pozycji krajowej literatury tej z przed kilkuset lat zostało „wygładzonych językowo” żeby nie powiedzieć przetłumaczonych z polskiego na polski wydano we współczesnym języku a tylko nie które stare zwroty pozostawiono w formie przypisów by nie mieszać młodzieży szkolnej w głowach.
To właśnie do osoby indeksującej jako bardziej doświadczonej i obeznanej w takich dewiacjach językowych metryk należy właściwe odczytanie sensu nieudolnie zapisanego cyrylicą, gotykiem itp. nazwiska czy imienia zniekształconego transkrypcją fonetycznego niewyraźnie wypowiedzianego słowa przez świadków lub usłyszanego przez tworzącego akt. W zamierzchłych czasach edukacja to temat raczej abstrakcyjny 3kl. ,to jak matura :)
Współcześnie wykształcenie średnie to minimum - no i dostępność komputerów i Internetu - to inny świat i możliwości.
Uważacie, że to nie Wasz problem bo tak to zapisał - również "niegramotny"- to wygodniej będzie przenieść to do indeksu niż wytężyć swój umysł i po namyśle wpisać bardziej wiarygodną wersję? Boicie się, że możecie rozminąć się z prawdą? A czy tą "prawdę" z przed kilkuset lat może ktoś z wówczas żyjących uwiarygodnić? Zastanówcie się! Tylko osoba współcześnie żyjąca dysponująca wieloma powiązanymi materiałami źródłowymi (metryki UMZ krewnych) i wiedzą praktyczna mająca dostęp może nich skorzystać i zaproponować wersję najbardziej prawdopodobną.
Indeksy tworzone są dla współczesnych i przyszłych użytkowników, którzy być może "dojrzeją" do tematu genealogii rodzinnej.
Zastanówcie się więc nad w/w aspektami Waszej wytężonej pracy bo przecież nie jest to tylko hobby!
Z poważaniem
GeneRys
Strona << | 1 | 2 | 3 | >>


Autor Komentarze
Komentarze
SympatykSympatyk



____________
Od: Lip 02, 2006 Posty: 4407
Napisano:Maj 03, 2024 - 13:58
Skomentuj ten artykuł w tym wątku
_EZFORUMCOMMENTS_USERINFO p
bielecki
SympatykSympatyk



____________
Od: Paź 18, 2007 Posty: 465
Napisano:Maj 03, 2024 - 20:28
Tyle, że taki przez autora artykułu wyobrażony indeks nie będzie już indeksem, ale czymś w rodzaju krytycznego opracowania księgi. To byłoby nawet pożyteczne dla genealogów dzieło, jednak jego wykonanie należałoby powierzyć najtęższym głowom z naszego grona, które lata spędziły na analizie metrykaliów z danego terenu.

W rzeczywistości w ogóle nie ma na przykład czegoś takiego, jak "poprawny zapis/brzmienie nazwiska". To tylko pewien konstrukt, w który łatwo uwierzyć ludziom dzisiejszym, których personalia zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej formy. Tak kiedyś nie było, jak dobrze nam wiadomo.

Łukasz Bielecki
_EZFORUMCOMMENTS_USERINFO p
Sroczyński_Włodzimierz
Członek PTGCzłonek PTG



____________
Od: Paź 09, 2008 Posty: 32207
skąd:Warszawa
Napisano:Maj 03, 2024 - 20:43
"zapisane są cyfrowo, więc z definicji nie mogą podlegać odstępstwom od jednej jedynej form"
nie ma takiej definicji i nigdy nie było. To mit. Lipa. Tak jak (skutecznie!) wmawiano w 30-40 lat temu "musi być bez polskich znaków bo t komputer" - tak i np dziś polskie (narodowo) nazwisko, które przeszło drogę mp z terenów CeCeCePi, cyrylicy i ukraińskiego alfabetu do "łacińskiej pisowni" od której zęby bolą - to nie konieczność, a wybór formatu/metody. Podobnie jak kobieta "ski".
System informacyjny (a za nim informatyczny) nie musi wymuszać "jednej jedynej formy". Cyfrowy czy niecyfrowy.

Co do meritum - nie ma, Łukaszu, sporu. Indeks (także, a może przede wszystkim w IT) ma swoje znaczenie. I miał w latach 50, 60, 70 XX wieku. Zbiór indeksowany też. Jeśli zbiór jest produktem , to i tak niczego to nie zmienia. Indeksując zbiór indeksuje się zbiór:) nie to co stanowiło podstawę do jego wytworzenia. I tyle:)

No może warto dodać (też z teorii i praktyki nauk informacyjnych), że indeksów (różnych) do zbioru (niepustego o ile pamiętam) może być naprawdę naprawdę dużo.
_________________
Bez PW. Korespondencja poprzez maila:


https://genealodzy.pl/index.php?module=MailUsers&op=main&touname=Sroczy%F1ski_W%B3odzimierz
_EZFORUMCOMMENTS_USERINFO p
semux



____________
Od: Kwi 20, 2023 Posty: 5
Napisano:Maj 03, 2024 - 23:14
Wydaje mi się, że już niedługo będzie można wykorzystać możliwości modeli językowych AI do opracowywania danych.
Na dziś podstawowym problemem jest rozpoznanie tekstu, choć nie jest z tym tak źle np. https://www.transkribus.org - to jeszcze daleko do ideału.
Ale jak już będziemy mieli treść dokumentu to możemy z niego wyciągać informacje.

Tu przykład możliwości ChatGPT w wersji 3.5
Podałem mu metrykę urodzenia mojego przodka o treści
"Działo się w Piotrkowie dnia dwudziestego pierwszego stycznia tysiąc ośmset sześdziesjątego szóstego roku, o godzinie czwartej po południu stawił się Walenty Muszalski lat trzydzieści mający w obec Tomasza Ostrowskiego mularza i Mateusza Wodzińskiego wyrobnika obu z Piotrkowa po lat czterdzieści mających i okazał nam dziecię płci męskiej urodzone w Piotrkowie dnia oszegdajszego o godzinie piątej w Wieczór, z jego małżonki Julianny z Piotrowskich lat trzydzieści jeden mającej Dziecięciu temu na Chrzcie Św. dziś uroczyście odbytym nadane zostało imię Antoni Walenty a Rodzicami jego Chrzestnemi byli: Tomasz Ostrowski i Agnieszka Krzeminska. Akt ten stawającemu i swiadkom przeczytany, a że pisać nie umieją przez nas tylko podpisany został."

I zadawałem pytania:
P: Czy ten tekst jest metryką ślubu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką zgonu? Odpowiedz tak lub nie.
O: Nie.

P: Czy ten tekst jest metryką urodzenia? Odpowiedz tak lub nie.
O: Tak.

P: Jakiej płci było urodzone dziecko ?
O: Urodzone dziecko było płci męskiej.

P: Podaj imiona i nazwiska rodziców
O: Rodzicami dziecka byli Walenty Muszalski i Julianna Muszalska z domu Piotrowska.

P: Podaj imiona i nazwiska świadków
O: Świadkami byli Tomasz Ostrowski i Mateusz Wodziński.

P: W jakim dniu urodziło się dziecko
O: Dziecko urodziło się „dnia oszegdajszego o godzinie piątej w Wieczór”. Tekst wydaje się zawierać literówkę lub błąd w przepisywaniu; prawdopodobnie miało być napisane "dzisiejszego", co oznaczałoby, że dziecko urodziło się tego samego dnia, co zarejestrowano akt urodzenia, czyli 21 stycznia 1866 roku.

P: W jakim dniu urodziło się dziecko ? Podaj datę w formacie YYYY-MM-DD
O: Dziecko urodziło się 1866-01-21.

P: Podaj wszystkie imiona dziecka i ustal jego nazwisko. Podaj tylko imiona i nazwisko.
O: Imiona: Antoni Walenty, Nazwisko: Muszalski

P: Podaj imiona i nazwiska rodziców chrzestnych
O: Imiona i nazwiska rodziców chrzestnych to Tomasz Ostrowski i Agnieszka Krzemińska.

P: Czy chrzestni lub któryś z nich był też podany jako świadek?
O: Tak, w tekście wspomniano, że Tomasz Ostrowski był jednym z rodziców chrzestnych dziecka oraz jednym ze świadków aktu, który nie potrafił pisać, więc podpisał się.

Jak widać można wyciągać wszystkie informacje Smile

Odpowiednie budowanie prompt'ów i będzie można budować bazy z danymi.
Potem wyobrażam sobie, że model nakarmiony danymi z metryk, będzie wyszukiwał pokrewieństwa, znajdował błędy, odkrywał historię zmian nazwisk itp.

Pozdrawiam
Sergiusz
_EZFORUMCOMMENTS_USERINFO p


Kliknij aby przejść do komentarzy na forum

donate.jpg
Serwis Polskiego Towarzystwa Genealogicznego zawiera forum genealogiczne i bazy danych przydatne dla genealogów © 2006-2024 Polskie Towarzystwo Genealogiczne
kontakt:
Strona wygenerowana w czasie 1.220804 sekund(y)