别再说”pdf格式”了

/**
* 本文隶属咬文嚼字科目
* 哈?什么叫“咬文嚼字”?
* 唔…就是…一种娱乐性质的较真,再次重申:较真有理,严谨无罪
* 等一下,上一行的“再次”和“重申”的“重”表达的是同一个意思,表意冗余了!
* 呐呐呐,上面这种行为就是咬文嚼字了
*/

问题描述

写这篇文章主要是想较真一个小问题,一种很常见的表达错误。

起因是今天Geek and poke的更新:

标题里的pedantic一词本意是“迂腐”的意思,不过在我眼里这个词和geek、nerd一样毫无贬义,而且相当酷。特别是小标题,很拽:“这事儿只有geek知道”。

指的是什么事呢?当有人说“存成pdf格式发给我”的时候,geek会反问一句,“你是说pd格式么”。为什么这么说呢,因为pdf的全称是”portable document format”,翻译过来就是“便携文档格式”,如果硬要加上“格式”说成“pdf格式”,那你就是在说“便携文档格式格式”了。

所以,别再说“pdf格式”了。

“pdf格式”格式的错误很常见

一旦开始注意,就会发现身边处处都是这样的错误(巴德尔迈因霍夫现象又来凑热闹了)。

挑一些有代表性的错误:

1. HTTP协议

HTTP,全称“超文本传输协议”。

HTTP协议,全称“超文本传输协议协议”。

同理的还有FTP协议、TCP/IP协议、SMTP协议等。

2. HTML语言

HTML,全称“超文本标记语言”。

HTML语言,全称“超文本标记语言语言”。

同理的还有XML语言、UML语言等。// @Tifan要记住:UML的M和HTML、XML的M不是一个词

3. TSP问题

TSP,全称“旅行商问题”或“货郎担问题”。

TSP问题,全称“旅行商问题问题”或“货郎担问题问题”。

同理的还有VRP问题。// 不过P问题和NP问题可不是这回事。

4. 还有还有

API接口、OCR识别、PCA分析、SVM机、IDE环境、UCD设计、Mac OS系统、WTO组织…

还一个重复最彻底的说法:ATM自动取款机

适当的较真是美德

有意思吧的武三同学表扬我的时候总爱说,“适当的较真是美德”。我一直以此作为心安理得较真的依据。

下午见了来京访问的@tifan小朋友,说起来正在起草的这篇文章。他说,会不会这是一种汉语言的表达习惯,不过根据PDF format来看,并不只是中国特色。他又说,会不会是全球范围内的一种通用语言模式,我想善良的他一定是在为这种错误找一个合理的解释。

我猜这种错误的产生主要有二:1. 不明了或不注意英文缩写的全称 2. 听别人说习惯了,自己也不觉得别扭了。不过,翻译成全称说,还真是分外的有喜感呐!

写博客考据到什么就会对那个话题走火入魔一段时间,本来刚从过度关注起床相关的事恢复出来,今晚又变得格外敏感这个冗余表达,浏览网页阅读文字,处处都能看到冗余表达的错误,真是无奈。

希望在以后的将来,我能尽快早些从这个状态恢复成平常的常态。

// 我想说,上面一句话有三处冗余表达…

// 还有…看来如果Sheldon真的存在于你我身边,他绝不会像电视里那么受欢迎

  • chys

    在计算机之外这种现象也太多了,最有名的恐怕是沙哈拉沙漠(沙哈拉就是大沙漠的意思)。如果连PDF格式都不能容忍,那看到 “datas” 这种得数用法不知是什么感受。

    • http://localhost-8080.com i404

      倒是也没啥不能忍的,说出来喜感一下-_-
      头一次知道撒哈拉是“沙漠”的事,看来那个伐木工人在“撒哈拉森林”工作之后改名“撒哈拉沙漠”的笑话站不住脚了

  • Justin Wong

    沙发~分享到校内了~

    • http://localhost-8080.com i404

      貌似不是沙花诶~最近的访问几乎都是从校内过来的,结果IE用户比例逐渐赶上Chrome的了

      • Justin Wong

        囧,慢了一步……

      • http://www.dreamsafari.info/ dreamsafari

        哥哥来给你贡献一个Firefox的流量。。。

        • http://localhost-8080.com i404

          哥哥太客气了,ff流量稳居第三的,Chrome 37%,IE 31%,FF 27%…

  • http://WalkinRaven.name 笨乌不飞

    每次您的文章都极端有趣,^_^

  • Pingback: Tweets that mention 别再说”pdf格式”了 | 考据癖 -- Topsy.com()

  • http://yskin.net yskin

    在adobe.com网站没搜到”PDF format”的说法,只有”PDF formatting”。

  • http://fivestone.info fivestone

    居然能随手列出这么多。。。女人真华丽

    • http://localhost-8080.com i404

      我当您是含蓄的表扬我呢吧…谢谢-_-

  • Gavin

    这个和把长江翻译成changjiang river,应该是一个道理吧,一个说法一旦专有名词化,通常就会被当成一个整体了。

    • Agaricus

      其实长江可以是yangtze river……

  • http://twitter.com/iderzheng Ider

    不知道doc文档算不算呢?对于pdf我一般都是“发一份pdf文档给我”,不过要是带上“转成”一次,还是会变成“把它们转成pdf格式给我”。现在HTML进入5了,就只说“HTML5”很少带“语言”二字了。哈哈。现在学算法中图的部分,也经常听教授带着浓重的口音说“TSP problem”。

  • Dsfdsf

    有些是不同语言间转化的问题,与缩写的原意无关。atm是纯外语,atm提款机则为夹生中文。当然,mkv格式另当别论。

  • http://www.julianyao.com Julian

    为chrome计数添砖加瓦,匿

    • http://localhost-8080.com i404

      Chrome已经上升到41.7%了…

  • dning1

    每次看完文章了评论还没加载完!!!!!!!

    关于文中说的问题,后缀文字可以看作是一种归类符号,便于识别。

  • dning1

    头像去哪儿设置?

    • http://localhost-8080.com i404

      还在纠结头像吗…你的已经是gravatar/twitter的头像了,放心吧~

  • zheng

    “IT技术”笑而不语,“DOS系统”表示赞同,印度河大声呼吁“印度原意就是河”,孟姜女哭道“老娘名在前姓在后是祖上传下来的规矩谁给老娘名字后面又加字”。依此推广,那些地名里带“州”、“城”、“京”、“都”之类的,后面加个市或县字简直是比基尼外套毛衣,多此一举了……

    • http://localhost-8080.com i404

      把英文缩写扩展到这么大的范围,太渊博了,佩服佩服

    • hcz

      京都市内牛满面

  • vibbow

    其实这种说法没有错误,后面的内容是对前面内容的一种补充。就像你说PDF把,有些人可能不知道这是一个什么东西,但是你说PDF格式了他们就知道这是一种格式。HTTP之类的也一样。

  • Allen

    PDF format不正确,dot PDF format正不正确?

  • http://twitter.com/im_wower 喔喔兒

    = = 蛮好玩的,

  • antpiyrin

    语言大抵如此,习惯了的为大众所接受的形式即便赈真在法语义上不通,也还是正确的。

  • http://pr4t.openwebster.com Ashes

    确实是语言习惯而已,很多已经成为固定词语了,比如“纳粹党”,“艾滋病”,“CD光盘”

  • ryan

    嗯嗯 geek这么纠结
    不知道纠结语言学的会有什么看法
    适度的信息的剩余虽看上去冗余却是必须,多余的信息才保证信息交流的可靠性
    另一方面看,语言毕竟不是一门科学,没有定理

  • 总舵主

    我喜欢这个博客。以后常来咯~

  • Siyichen

    对于电子行业,我经常纳闷的是PCB板。 PCB=printed circuit board

  • xslidian

    以偶的习惯 假定 pdf 是刚兴起的格式 在一篇文章中偶会先用“PDF 便捷式文档格式”介绍 以后就缩略地讲“PDF 格式” 这样可以帮助读者回想起“F”代表什嘛
    不过这个 pdf 确实已经专有化了

  • 梁海

    哈,从 O’Reilly 那篇文章知道这里的,很有意思。同样身为考据癖,我倒觉得,专有名字 + 通用名词的这样一个组合有时比较合适,不仅让语言表达的内容更加明了,还和其他的 专有名词表述更加统一(如“JPEG 格式”、“MP3 格式”、“DOC 格式”)。

  • lydone

    我觉得都是CCAV的错吧。NBA美国职业篮球联盟神马的……

  • reno

    “PDF格式”指的是名字是PDF的格式,或者说名字叫“Portable Document Format”的格式,所以这样讲完全没有问题。要说冗余也是他名字起的有冗余。

  • 雨忆

    i404同学真是博学。 不过话说回来我觉得大家都是通过后缀名来判断格式名的吧。 比如doc格式啦。 jpeg格式啦这样的 都是 doc jpeg作为后缀的。 pdf也作为后缀 大家自然就以此为格式名了。 其实还是怎么方便理解怎么来吧。 符合风俗什么的。 话说在南方的一些方言里头 二十二都是读二二的。 三三,三四 这样的说~

  • http://weakish.github.com weakish

    這個現象好像真的是跨語言的。記得大一還是大二的時候那個《新視野英語》課本上一篇講AIDS的文章裏用到了“HIV virus”這個詞組。我當時就很奇怪,問老師,老師說這種用法很多。

    Google 一下 perl language,你會發現使用非常廣泛,perl.com就用。

    出現這種現象我覺得可能以下的幾個原因:
    一、由於縮寫的使用十分廣泛,縮寫的全稱已經被人們淡忘了,所以人們不覺得這是冗餘
    一、向不了解這個概念的人提及時用冗餘說法可以更有效地溝通,比如PDF格式,如果我是第一次聽到,通過上下文,我很容易地能理解這是一種文件格式,至於到底是什麼樣的格式,全稱是什麼,我沒有必要也沒有興趣知道
    一、縮寫容易引起歧義,使用冗餘說法可以避免歧義

    • BML

      是不是就像us geek这样的同位语呢

      • http://weakish.github.com weakish

        我贊同,可以看成同位語。一種看似冗餘的同位語。

  • http://smilett.com smilett

    嗯~还有IPV4, IPV6。。。

  • http://bisuu.blogspot.com 不执着

    其实国人说”pdf格式”想表达的是”pdf扩展名”…

  • blanu

    其实中文很多词也有冗余,比如凯旋归来、十分悬殊等等
    语言嘛,只是交流用途,严谨性是要有的,但是也不能过于纠结,毕竟语言本身就包含无限的不确定性。反而我觉得这样的冗余能帮助理解

    • AillyLi

      部分同意,冗余也是支撑繁杂系统的核心,在认知科学里,人类神经信息的冗余加工和并行处理增加了我们生存的几率【好像扯得有点远233

  • @Verify

    DOS系统叫DO系统?IT技术叫I技术?难听~

  • Exiscetti

    RT三角形…

  • Xx88721

    pdf里把portable翻译成便携的并不准确,这里portable应该是可移植的意思。也就是从某一环境到另一个环境的可移植性比较高。而便携是指方便携带。。。在merriam-webster上这是两个不同的释义。

    • http://localhost-8080.com i404

      谢谢指正,参考维基翻译的,也修正一下维基词条吧,中文维基词条很多还需大量完善

  • Fuguxo

    pdf格式可能还会叫下去,尽管可能不符合博主自认为正确的标准。

    我认为这可能因为与古代汉语相比,现代汉语的基本组成单位不再是单个的字而是词语。pdf、gif这些玩意无论多长,只相当于一个单字,不在后边加“格式”,不符合现代汉语的表达习惯。约定俗成与习惯比试图确立所谓的标准更有意义。而且语言是发展的,现代汉语在古代人看来不知道多冗余,那又怎样呢?

    当然,博主也可以这样主张,只要足够多的人接受,说不准以后就都改了呢?

    • Diudiu

      我觉得博主只是想顺着漫画的geek幽默延伸一下,把这些缩写变成全称连起来的确很有喜感呐 =v= Sheldon一定会纠正Penny的这个错误的,哈哈
      文章一开始就强调是娱乐性质了嘛,我倒不觉得是博主的什么主张或是自认为正确的标准,只是这篇文章的娱乐点~各位take it easy就好咯

  • 右京样一

    我原来也很反感,但后来发现汉语单音节词过度成双音节词的时候带来了大量冗余。比如“修长”,比如“美丽”,比如“恐惧”……

  • http://rhgb.myopenid.com/ rhgb
  • hyh

    其实你漏了几个⋯⋯ 比如 ATM机,应该是 AT Machine。哈哈

  • Silvia

    这个似乎是叫做RAS syndrome (short for “redundant acronym syndrome syndrome”),有些是有“正当”理由的,不应当一概斥作语病,可以参考wiki的reasons for use部分:
    http://en.wikipedia.org/wiki/Redundant_acronym_syndrome_syndrome 

  • 晓枫未暖

    Windows 2000的开机界面上写着“基于NT技术构建”……

  • http://www.tanglei.name/ tanglei

    有意思

  • Prime314159

    某天某人说:这东西是我自己DIY的。。

  • 荒野无灯

    有些东西,大家已经叫成习惯了。要众人都这么叫,很困难。

  • 路过

    真好看 有意思 评论也超好看

  • Javion Chan 子夕雨

    【炒冷饭】呐,我们给这种现象起个名字吧?

  • Tony

    本人常常也会在意这些语言细节,对一次关注词语的意义源于《你的第一本哲学书》([美国]托马斯·内格尔):
    “举个简单的例子来说,“烟草”这个词指的是一种特定的植物,我们大多数人都不知道它的拉丁文学名怎么说,但却都知道它的叶子被用来做雪茄和香烟。我们都见过和闻过烟草,但是你用这个词的时候,它并不只是用来指你见到的烟草,或者你周围的烟草,而是指所有的烟草,无论你知不知道它们的存在…….”
    那么我如何理解这一现象,让我这个强迫症患者好受一点呢?首先,语言的目的是交流,些许不规范的表单方式在客观上已完成了他的使命。其次,“PDF格式”可以理解为“PDF那种格式”,如果说“PD那种格式”就会让人感觉不知所云,但完整的说也很冗长,所以省略指示代词“那种”。
    P.S.其实平时生活中这种事情时常发生,我们能做的就是自己尽量使用规范的表达方式,但实际上有时候那反而会增加沟通上的成本。比如一部分人吧Delphi视作编程语言,实际上严格来说它是IDE,我可不愿多花时间跟他争论。

  • 滇狐

    过来测试一下头像。

  • 暗影吉他手

    不敢苟同。日常生活用语中“PDF格式”中的“格式”指的是文件扩展名,和”PDF文档“、”PDF文件“等的说法等同,和F不冲突。“PDF格式”翻译过来不是“便携文档格式格式”,而应该是”扩展名为PDF的文件“。

  • Pingback: 使用KodExplorer搭建强大的私有云盘 - Sky的博客()

  • Venus

    《TCP/IP 详解》卷1 2.2 节 原话 “The ARP and RARP protocols (Chapters 4 and 5) map between the 32-bit IP addresses and the 48-bit hardware addresses.” 里面就有 “ARP and RARP protocols”。