先交作業。
今天上課的講義如下:
1.中國機讀編目格式的相容性
2.The marc21 format
3.中國編目規則
4. Aacr2
5.Marc的結構
6. General introduction of marc21
老師學生時代只有輔仁、臺大的學歷被英國承認,其他學校都要從大三念起。
大學畢業也不一定出人頭地,賺錢和大學學歷沒有關係。
吃湯圓表示對學姐支持。
〈marc的結構〉
欄位式(左邊有欄位,右邊有資料)
條碼號、處理狀態不會放在marc顯示裡
磁帶格式 (ISO 2709)、驗證單格式、卡片格式 (ISBD) (書後面的出版品預行編目)、條列格式(欄位式)。
古時資料轉換是用磁帶
Marc(全名:MAchine-Readable Cataloging):製作目錄的方式,製作結果是一筆一筆的record。
美國的狀況:第一版很不好,幾個月後改成MARC II。
1996 marc21是21世紀的,但是臺現在才要用,過了17年
英國國家書目也是同時在研究。
科技史上常見同一時間發明、發現。
1980世界各國都成熟。
1986年的資料顯示,已有21個國家圖書館將國家書目以機讀編目格式發行磁帶Inte, 大約有14種不同的規格。
不同規格間怎去交換,可是哪一個機器可讀,怎去調整。
到了1995年(過了十年),至少有60個國家的國家圖書館發行該國的磁帶機讀編目格式; 其中, 一半採用 USMARC 格式, 四分之一採用 UNIMARC 格式, 其它的四分之一採用 UK MARC、MAB、InterMARC等格式。(各自國家的)
Us marc市場占有率大,因帝國主義,用政經文力量壓迫其他國家用。
喝可樂也是如此。
臺從1980年開始做這件事 中國圖書館學會與國立中央圖書館(今國圖)
於1980年成立「圖書館自動化作業委員會」。謀求:(目地有四)
- 1. 研訂中文機讀編目格式 (Chinese MARC Format), 作為國內外目錄作業之規範。 錯的,機讀編目格式沒有語言差異。要讀他國資料去安裝軟體即可。 再過30年就沒有本省外省之別,只有新住民,舊住民
- 2. 合作發展圖書資料自動化作業系統, 以改進圖書資料處理技術及圖書館資訊服務。
- 3. 建立中文資料庫, 並引進國外資料庫, 以應資料查詢之需要。
- 4. 建立全國資訊網, 以配合國家建設之需要, 並促進學術之研究與發展中國。
1980第一版,很快出第二版
1989年後才會容納其他資料
1984採用unimarc規格,但實沒有
1994年納入中央標準局 英文名CNS13226 很詭異,被人罵死
目前臺重要全國圖書資訊網路 NBINet 臺幾個圖書館書目資料送上來。臺蠻穩定,公開。而中需密碼,取得容易,只要寫封信即可得知。
磁帶格式 - ISO 2709
ISO(全名:the International Organization for Standardization)
會有一檔案告訴我們iso是啥
現最新版本:2008
拿來作為交換資料的格式 有英法兩版本 iso2709-2008(老師有下載,共12頁)
Information and documentation—
00811cambb2200241bib450b0010008000000100
0250000810000400003310100080007310200070
0081200008400088205000900172210005800181
2150018002396100036002576770016002936870
0150030970000340032470100150035877000250
0373801003200398805004700430805009300477
#1276466#0b$a9578468237$dN.T.$250#bb$a19
861125f1997bbbbbbby0chiy09bbbbbbe#0b$ach
i#bb$acw#1b$a聖經密碼$rsheng4bjing1bmi4b
ma3$f卓思寧(Drosnin,Michael)b著$g杜默b譯
$ak聖經b密碼#bb$a初版#bb$a台 北市$c大塊文
化$d民86$ak台北b台北市b北市$ck大塊b文 化#
0b$a269面$d21公分#b0$a聖經-專題$ak聖經b聖
經-專題b專題#bb$a241.4$b2163#bb$a160R$b
2163#b0$a卓思寧$c(Drosnin,Michael)$4著#b
1$a杜$b默$4譯#b1$aDrosnin$bMichael$4著#b
1$acw$b輔仁大學$c19980115$gCCR#bb$a輔仁大
學$b文圖$cE314598A$d241.4$e2163$tCCH#bb
$a輔仁大學$b神圖$cE003589T$d160R$e2163$p
TB$tX$a輔仁大學$b神圖$cE003765T$d160R$e2
163$pTB$tX%01034cam0b2200277bbb450b00100
0800000010003600008100004000044101000800
0841020007000921050018000992000087001172
0500110020421000800021521500180029545400
3600313606006000349606006000409606005800
4696770014005277000046005417020015005877
0200150060270200130061780100320063080500
9500662#1379131#0b$a9578909551$b(平裝)$d
新台幣350元#bb$a19980514d1997bbbbkbby0ch
ib09bbbbbbe#0b$achi#bb$acw#bb$aabbbzbbb0
00yy#1b$a上帝的指紋$f葛瑞姆.漢卡克著$g李
永平譯$rshang4bdi4bde5bzhi3bwen2 $ak上帝b
指紋$gk永平#bb$a第一版#bb$a臺北市$c臺灣先
智$d1997[民86]$ak臺北b臺北市b北市$ck臺灣
b臺灣先智b先智$dk民86#0b$a435 面$d21公分
#b1$12001b$aFingerprintsbofbthebGods#bb$
2csh$a文化史$x上古(原始至公元500年)$ak文
化b文化史$xk公元#bb$2csh$a文化史$x上古(原
始至公元500年)$ak文化b文化史$xk公元#bb$
2csh$a世界史$x上古(原始至公元500)$ak文化
b文化史$xk公元#bb$a913$b3424#b1$ a漢卡克$
b葛瑞姆$4著$ak漢卡克$bk葛瑞b葛瑞姆#b0$a李
永平$4譯#b0$a李永平$4譯#b0$a汪仲$4譯#b0
$acw$b輔仁大學$c19980514$gCCR#bb$a輔仁大
學$b文圖$cE317199Abv.1$d913$e3424$tCCH$a
輔仁大學$b文圖$cE317200Abv.2$d913$e3424$
tCCH% (16進位的編輯器) Marc顯示會成為這樣
兩筆資料,一個byte一個byte連續排下去,沒有分行。轉換的錯誤也保留。
全部都連在一起。
1997、8年非常流行的書《聖經密碼》任何是聖經裡都有寫。
Iso646
ISO/IEC 646 |
||||||||||||||||
_0 |
_1 |
_2 |
_3 |
_4 |
_5 |
_6 |
_7 |
_8 |
_9 |
_A |
_B |
_C |
_D |
_E |
_F |
|
|
NUL |
SOH |
STX |
ETX |
EOT |
ENQ |
ACK |
BEL |
BS |
HT |
LF |
VT |
FF |
CR |
SO |
SI |
|
DLE |
DC1 |
DC2 |
DC3 |
DC4 |
NAK |
SYN |
ETB |
CAN |
EM |
SUB |
ESC |
FS |
GS |
RS |
US |
|
SP |
! |
" |
|
|
% |
& |
' |
( |
) |
* |
+ |
, |
- |
. |
/ |
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
: |
; |
< |
= |
> |
? |
|
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O |
|
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
|
|
|
|
_ |
|
|
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
o |
|
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
|
|
|
|
DEL |
(資料來源:http://en.wikipedia.org/wiki/ISO/IEC_646)
a 61 0~f(15) 做出來的都是可顯示的 黃色控制碼(無法用印表機印出)
十進位表示:0~127
Marc要用二進位
Bit 8
Byte 1024=210
Kib byte KB→kb→kb
Mega
Giga
Tera
Z
每一bit用0、1表達 0101 1111 5d 15d 5H FH 5FH A 41H 65D 0100 0001
D(10進位) h(16進位)
A 10D12D 01000001(A) 10100000(10D) 10101100(12D) 01100001(a)
A 61H
10:LF(linefeed) 12:FF(FormFeed)
Aa 2bytes(多存了檔案中止符號)
A
a 4bytes
把marc顯示存成word檔,每一列多4 bytes。
美1966年故事,臺1980年故事。每一個byte都非常重要,都要去省。
老師學程式時的評分標準:程式本身byte數最少,同byte去跑用的memory較少。
今天發明就不會有iso2709。
在 ISO 2709 的格式裡,依其性質,每筆書目記錄的內容,可以分為四個部份,依序是:
- 1. 記錄標示,最前面的24個位元組。
- 2. 指引,每個指引以12個位元組構成,可以有無數個指引。
- 3. 書目資料欄
- 4. 記錄終止符號13148
00811是這個紀錄長度 中文字占2個byte
性質 |
位址 |
記錄 1 |
記錄 2 |
|
記錄長度 |
0 - 4 |
00811 |
01034 |
|
記錄性質 |
5 |
c |
c |
|
執行代碼 |
記錄類型 |
6 |
a |
a |
書目性質 |
7 |
m |
m |
|
層次等級 |
8 |
b |
0 |
|
未定 |
9 |
b |
b |
|
指標長度 |
10 |
2 |
2 |
|
分欄識別長度 |
11 |
2 |
2($a、b) |
|
資料基位 |
12 - 16 |
00241 |
00277 |
|
記錄補釋 |
著錄依據 |
17 |
b |
b |
著錄格式 |
18 |
i |
b |
|
未定 |
19 |
b |
b |
|
指引格局 |
欄長位數 |
20 |
4 |
4 |
首字位址 |
21 |
5 |
5 |
|
執行定義部份長度 |
22 |
0 |
0 |
|
未定 |
23 |
b |
b |
|
欄號 |
資料欄長度 |
首字位址 |
001 |
0008 |
00000 |
資料欄長度最長:9999
每一筆書目紀錄最長可放多少個byte(書目紀錄本身):9999(超過iso2709會爆掉)
ISSN有八位數01234567,最後一碼檢查號不算,理論上可容納10000000個期刊, 當第10000001個去申請就會爆掉。
身分證號理論上可容納26億人(108*26)
C是修正後的紀錄,每一個都是,誰敢沒有修正。