Aineistoluettelo sisältää PIKI-tietokannassa olevan bibliografisen metadatan. Uusin data on ajalta 7.11.2012. Mukana ovat sekä emotietueet (esim. CD-levy) että osakohteet (esim. CD-levyn kappaleet). Luettelossa on normaalitietueita ja siitä on jätetty pois ns. ennakkotietueet, kaukolainatietueet ja keskeneräiset tietueet.
- Formaatti: MARCXML (perustuu MARC21-formaattiin)
- Tietueiden määrä: n. 2 300 000
- Tiedoston koko pakattuna (gzip): 225Mt
- Tiedoston koko purettuna: n. 4.47Gt
- Merkistökoodaus: UTF-8
Mukana ovat teokset, joilla on vähintään yksi nide kimpan jossain kirjastossa.
Aineistoluettelo on pilkottu useampaan osaan.
Lyhyesti tietueiden rakenteesta:
- controlfield ja datafield -kentissä tag-määrite kertoo mistä MARC 21 -kentästä on kyse, esim. tag-määrite "245" sisältää nimeke- ja vastuullisuusmerkinnöt.
- PIKI-tietokantaa on alettu rakentaa jo 1980-luvulla. Lukuisten konversioiden sekä luetteloinnissa tapahtuneiden muutosten vuoksi siinä on erilaisia ”historiallisia” kerrostumia ja jopa virheitä. Konversioissa on muun muassa liitetty eri kuntien tietokantoja PIKI-tietokantaan ja vaihdettu luettelointiformaattia FinMARCista MARC 21:een. Virheet eivät kuitenkaan ole kriittisiä tai estä tietokannasta tehtäviä analyysejä.
Lisäohjeita: PIKI-blogi.