35. 通用唯一识别码UUID

2017-04-28
作者 : 云客
本节点价格 : 免费
云客Drupal源码分析
0
- 登录后才能发表评论

面包屑导航
1. 首页
2. 云客Drupal源码分析
3. 35. 通用唯一识别码UUID

先来看一个问题：假设一个网络系统每秒钟需要保存数十万来自用户提交的信息，并分配一个id给每条信息用于以后唯一标识它，那么怎么产生这个id呢？不能重复又要足够快以支持高并发，有这么强大的单台服务器吗？即便有，随着并发加大也是很难满足的，看来从设计上不能依赖于单台服务器。此外有些信息对象会跨系统存在，由于业务原因，需要进行全局唯一标识，比如一个业务单号，业务只关注这个业务单本身而不关注当前是哪台服务器在处理这个业务；这些就是uuid存在的原因。

UUID：通用唯一识别码Universally Unique IDentifier，有时也被称为GUID全局唯一识别码Globally Unique IDentifier，最初用于阿波罗网络计算系统，后来开源软件基金会用于许多分布式计算环境中，也用在微软window平台里，它是一个用以解决跨时空唯一性标识问题的东西，所谓跨时空表示在有限的时间和空间内，能够保证产生的id是独一无二的，这样一来就能解决上文提到的问题，但这里有个关键词“保证”需要注意，其实没有绝对的东西，只要概率极其低那么我们可以“保证”，这对于处女座的人来说可能是一种煎熬，但愿看完UUID机制会得到安慰，接下来看一下UUID如何做到概率极其低，到底有多低。

UUID参考：

关于UUID的规则在rfc4122中描述，详情见：

http://www.rfc-editor.org/rfc/rfc4122.txt

关于这篇RFC有一个勘误，是关于字节序的，见：

http://www.rfc-editor.org/errata_search.php?rfc=4122&eid=3546

UUID:

UUID是一个有128比特的位串（16字节），以十六进制字符的方式来表示，格式为8-4-4-4-12

正则描述为：'[0-9a-f]{8}-([0-9a-f]{4}-){3}[0-9a-f]{12}'

如：34415db0-ed84-48e5-8aae-9d7e03bb45e9

这128比特的位串具备一定的格式，从第一位顺序描述如下：

time_low ：4字节32位，表示时间的低字段

time_mid ：2字节16位，表示时间的中字段

time_hi_and_version：2字节16位，前4位表示uuid创建类型的版本（见后），其余位表示时间的高字段

clk_seq_hi_res：1字节8位，前2到3位表示uuid版本变体（见后），其余位表示时钟序列高字段

clk_seq_low：1字节8位，表示时钟序列低字段

node：6字节48位，表示空间上的识别标识

uuid的设计目的是去中心化，不论世界上哪台计算机在什么时间产生的uuid需是唯一的（实际上是重复概率极其低），从上面可以看到有60位来表示时间，精度是100纳秒级别，目前服务器程序运行速度大多在毫秒级别，在同一台计算机上同一程序可以保证不停生成uuid也是不同的（在rfc4122里面也描述了超高频率获取uuid的解决办法），但这里有一个问题，计算机的时间可能重复，比如有些设备掉电后会丢失时间，这样一来产生相同uuid的几率就变大了，所以引入时钟序列字段克服这个问题，在系统初始化时时钟序列字段应该是一个随机值，解决了时间上可能相同的问题，再解决空间上相同的问题，node有48位，典型的它可以是网卡的MAC地址、IP地址、主机名、url等，唯一标识一台设备的标识，以此避免空间上的重复。

有时候软件不能获取到时间或者设备标识，那怎么办呢，可以采用随机数的方式，那么如何识别以何种方式创建的uuid？这就是前文提到的uuid创建类型版本字段的作用，它有4位，目前定义了5种创建方式，网上摘录如下：

UUID Version 1：基于时间的UUID

基于时间的UUID通过计算当前时间戳、随机数和机器MAC地址得到。由于在算法中使用了MAC地址，这个版本的UUID可以保证在全球范围的唯一性。但与此同时，使用MAC地址会带来安全性问题，这就是这个版本UUID受到批评的地方。如果应用只是在局域网中使用，也可以使用退化的算法，以IP地址来代替MAC地址－－Java的UUID往往是这样实现的（当然也考虑了获取MAC的难度）。

UUID Version 2：DCE安全的UUID

DCE（Distributed Computing Environment）安全的UUID和基于时间的UUID算法相同，但会把时间戳的前4位置换为POSIX的UID或GID。这个版本的UUID在实际中较少用到。

UUID Version 3：基于名字的UUID（MD5）

基于名字的UUID通过计算名字和名字空间的MD5散列值得到。这个版本的UUID保证了：相同名字空间中不同名字生成的UUID的唯一性；不同名字空间中的UUID的唯一性；相同名字空间中相同名字的UUID重复生成是相同的。

UUID Version 4：随机UUID

根据随机数，或者伪随机数生成UUID，实际中往往使用密码学上的强随机数生成器。

UUID Version 5：基于名字的UUID（SHA1）

和版本3的UUID算法类似，只是散列值计算使用SHA1（Secure Hash Algorithm 1）算法。

前文还提到clk_seq_hi_res中有两到三位的版本变体Variant字段，它是什么意思呢？可以理解为uuid字段布局的版本号，在uuid中全部字段位的含义都依赖于这个字段值的设置，相当于是uuid机制的版本号，以上解释的字段含义目前定为10，只用了两个位；Variant字段的其他值或为应对未来变化而保留，或为兼容性考虑。

通过上面的介绍，除开创建版本的4位和变体字段的两位，还有122位，这是一个很大的数字（5后面加36个零），系统产生相同uuid的概率是非常非常小的，这个是一个什么概念呢，形象的说：

中彩票头奖的概率是千万分之一级别，假设每秒买一张彩票，一直买10的21次方年，全都中头奖，可能发生这样的事情吗？

或者1千亿台计算机，每台每秒产生1亿个uuid，需要一百六十亿年才会重复

这样的概率就是uuid重复的概率，是否能让处女座的人们安心的认为uuid能担保不重复呢？

drupal中的uuid：

在drupal中实体用到了uuid，如果网站规模做的很大时，会涉及数据库分表分库，此时uuid将带来帮助，系统中uuid由以它命名的uuid服务提供，如下：

容器服务id：uuid

类：Drupal\Component\Uuid\Php

使用方式：echo \Drupal::service("uuid")->generate();

程序代码解释如下：

class Php implements UuidInterface {
  public function generate() {
    // 使用密码级别的随机数生成器产生高质量随机性，将二进制转为16进制，$hex有32个字符
    $hex = bin2hex(Crypt::randomBytes(16));
    // 一个字节有两个十六进制字符，提取8个十六进制字符，4字节32位比特，表示时间低字段
    $time_low = substr($hex, 0, 8);
    //两字节表示时间中字段
    $time_mid = substr($hex, 8, 4);
    //此处字符4（不是数字）表示uuid创建版本为4，意指使用随机数生成，占用4比特位
    $time_hi_and_version = '4' . substr($hex, 13, 3);
    // 提取8比特位，并转换为十进制整数
    $clock_seq_hi_and_reserved = base_convert(substr($hex, 16, 2), 16, 10);
    //将前两位设置为0
    $clock_seq_hi_and_reserved &= 0b00111111;
    //将前两位设置为10
    $clock_seq_hi_and_reserved |= 0b10000000;
    //提取1字节（8位）做时钟序列低位
    $clock_seq_low = substr($hex, 18, 2);
    //余下的6字节48位作为设备标识
    $node = substr($hex, 20);
    //格式化输出
    $uuid = sprintf('%s-%s-%s-%02x%s-%s',
      $time_low, $time_mid, $time_hi_and_version,
      $clock_seq_hi_and_reserved, $clock_seq_low,
      $node
    );
    return $uuid;
  }
}

可以看出uuid的第三段的第一个字符始终为4，是因为drupal使用随机数的方式来生成uuid，既没有用到时间也没有用到设备标识，第四段的第一个字符为二进制10**表示的值，那代表目前uuid的版本类型

在drupal中uuid是以组件方式提供，同时还提供了其他几种生成方式，但需要扩展支持

如果需要验证一个uuid可使用：

Drupal\Component\Uuid\Uuid:: isValid($uuid);

返回bool值，表示是否符合uuid的特征。

本书共161小节。

云客Drupal源码分析
免费
1. 自动加载器与Composer
免费
2. 请求对象Request及请求堆栈
免费
3. 响应对象及Cookie设置
免费
4. Session系统
免费
5. 服务容器及Symfony依赖注入组件
免费
6. HttpKernel堆栈
免费
7. 缓存系统Cache
免费
8. 页面缓存的请求策略及响应策略
免费
9. php流、公共文件、私有文件
免费
10. Session进阶
免费
11. 数据库系统及其使用
免费
12. 数据库Schema及创建数据表
免费
13. 核心处理流程HttpKernel（drupal8执行流程）
免费
14. 认证Authentication系统、认证提供器
免费
15. 路由系统Route
免费
16. 网站维护模式
免费
17. 控制器执行及其解析器controller_resolver
免费
18. 页面标题
免费
19. 渲染数组（render array）
免费
20. 渲染上下文RenderContext、渲染器renderer
免费
21. 缓存上下文CacheContext
免费
22. 钩子、模块处理器、函数定义
免费
23. 渲染占位符及其产生器
免费
24. 渲染缓存RenderCache
免费
25. 合并数组
免费
26. 插件系统Plugin（上）
5.00 元
27. 渲染数组的元素类型
5.00 元
28. 状态信息state及键值储存系统
5.00 元
29. 类型化数据Typed Data API
5.00 元
30. symfony验证器组件validator
5.00 元
31. 数据验证Validation
5.00 元
32. 国际化Internationalization：核心翻译系统
5.00 元
33. 实体Entity概述
免费
34. 实体类型管理器、实体类型、实体
5.00 元
35. 通用唯一识别码UUID
免费
36. 权限系统（上）
免费
37. 权限系统（下）
免费
38. 数组操作
免费
39. 配置系统Configuration（一）
5.00 元
40. 配置系统Configuration（二）
5.00 元
41. 配置系统Configuration（三）：配置schema与类型化
免费
42. 配置系统Configuration（四）：配置schema与类型化
免费
43. 实体entity（一）：实体基类
免费
44. 实体Entity（二）配置实体基类
免费
45. 实体entity（三）配置实体储存处理器
免费
46. 有向无环图及依赖处理
5.00 元
47. 用户角色实体
免费
48. 语言Language
免费
49. 实体Entity(四）：内容实体概述Content Entity
免费
50. 插件系统（中）
免费
51. 字段API（上）
免费
52. 字段API（中）
免费
53. 实体Entity（五）内容实体基类
免费
54. 实体类型bundle信息服务entity_type.bundle.info
免费
55. 字段API（下）
免费
56. 实体字段管理器entity_field.manager
5.00 元
57. 内容实体数据库表结构及表映射table mapping
免费
番外篇：PHP开发者的JavaScript快速文档
免费
58. 实体entity（六）内容实体储存处理器类
5.00 元
59. 内容实体储存模式处理EntityStorageSchema
5.00 元
60.实体查询entityQuery
免费
61.渲染管道及显示变体DisplayVariant
5.00 元
番外篇：jQuery表单库jquery.form.js
免费
62.会话系统Session高级篇
5.00 元
63. 网络攻击与防御措施
免费
64. 表单定义示例
免费
65. 表单Form API
免费
66. id、class命名及Html辅助类
免费
67.Url和Link
5.00 元
68. 锁lock服务
免费
69. 日志系统与监控
免费
70. 内部动态页面缓存dynamic_page_cache
5.00 元
71. 主题引述
免费
72. 资源库assets library详解
10.00 元
73. 主题处理器theme_handler
免费
74. 主题协商theme negotiator
免费
75. 主题初始化器
免费
76. 主题钩子注册theme.registry
10.00 元
77. 主题管理器themeManager
免费
番外篇：原生twig模板引擎详解（上集：设计师篇）
免费
番外篇：原生twig模板引擎详解（下集：开发者篇）
免费
78. PHP代码储存PhpStorage
免费
79. twig服务
10.00 元
80. 占位符策略placeholder_strategy
免费
81. 响应附属处理attachments_processor
免费
82. 资源解析器AssetResolver
免费
83. 资源css与js优化处理
免费
84. 插件系统（下）
5.00 元
85. 表单进阶
免费
86.实体类型知识库entity_type.repository
免费
87. 配置实体查询
免费
88. 临时储存与消息服务
免费
89. 语言Language模块
10.00 元
90. 系统出入站路径处理
免费
91. 块系统block
免费
92. 条件插件condition plugins
免费
93. 帮助系统help
免费
94. 系统管理工具栏toolbar
免费
95. 实体表单entity form
10.00 元
96. 实体表单显示EntityFormDisplay
10.00 元
97. 实体表单验证（上）
10.00 元
98. 实体表单验证（下）
10.00 元
99. 字段控件FieldWidget
免费
100. 节点表单NodeForm
免费
101. 音译转化Transliteration
免费
102. 实体视图构建器EntityViewBuilder
免费
103. 实体视图显示及格式化器
免费
104. 实体列表构建器EntityListBuilder
免费
105. 分页器pager
10.00 元
106. 实体访问控制处理器AccessControlHandler
免费
107. 节点实体访问控制处理器
10.00 元
108. 导航菜单Navigation menus
免费
109. 菜单本地任务MenuLocalTasks
免费
110. 菜单本地动作MenuLocalActions
免费
111. 菜单上下文连接Menu contextual links
免费
112. 前端js中的翻译
免费
113. 前端JavaScript（一）全局设置与前端API
免费
114. 前端JavaScript（二）jQuery、进度条等
免费
115. 前端JavaScript（三）表单状态处理
10.00 元
116. 前端JavaScript（四）防抖与消息处理
免费
117. 前端JavaScript（五）表单库与安全边距库
免费
118.系统AJAX（一）：概述与示例
免费
119. 系统AJAX（二）：前端原理
免费
120. 系统AJAX（三）：后端原理
10.00 元
121. 系统AJAX（四）：命令
免费
122. 对话框dialog
免费
123. 自动完成API(autocomplete API)
免费
124. 实体自动完成autocomplete
10.00 元
125. 文件系统基础
免费
126. 占位符替换token服务
免费
127. 文件上传与管理（上）
免费
128. 文件上传与管理（下）
免费
129. 队列queue
免费
130. 计划任务cron
10.00 元
131. 批处理batch
免费
132. 面包屑路径
免费
133. 时区Time Zone
免费
134. 日期与时间
免费
135. 洪水控制防护flood
免费
136. 密码储存
10.00 元
137. 邮件系统
免费
138. 注册与注销
免费
139. 登录、退出、重置密码
免费
140. 视图views的使用（上）
免费
141. 视图views的使用（中）
10.00 元
142. 视图views的使用（下）
免费
143. 视图views开发
10.00 元
144.批量更新BulkUpdate
免费
145. 搜索search
免费
146. 多步表单multi-step form与表单重建rebuildForm
10.00 元
147. 配置的安装与卸载
免费
148. 配置同步（导入、导出）
免费
149.模块安装与卸载过程
10.00 元
150. 接口翻译导入导出与删除
免费
151. 系统更新
10.00 元
152. Drupal系统初始安装逻辑
免费
153. 完结篇，云客drupal源码分析系列终于完成了
免费
154. 前后端解耦Drupal JSON API
免费
155.发起HTTP请求GuzzleHttp
免费
156. Drupal移动APP、物联网开发之RESTful使用篇
免费

云客在 7. 缓存系统Cache中留言：

回复你的第一个问题：
配置和路由储存到数据库主要是高负载架构问题，在大型系统中，会有多台WEB服务器对一个数据库，数据库还会做主从分离，这种情况下，如果放在某台服务器的文件系统中，其他服务器怎么访问呢？
第二个问题，缓存三要素引起缓存失效时，会更新缓存系统

晴空在进阶篇8. 实践：首页模板的制作4——转换3中留言：

代码肯定没有问题。

{{ page.xxx }} 这条命令，是在page模版中打印“区域”的官方规定，这个规定从drupal8开始到现在已经有将近7年时间了，从来没有变过。这里的重点在于:

晴空在 153. 完结篇，云客drupal源码分析系列终于完成了中留言：

George Bernard Shaw said “The reasonable man adapts himself to the world; the unreasonable one persists in trying to adapt the world to himself. Therefore, all progress depends on the unreasonable man.”

萧伯纳说，识时务的人适应社会。不识时务的人坚持试着让世界适应自己。因此，所有的进步，都有赖于那不识时务的人。

在这个信息爆炸、标题党横行、只要你稍微有点追求你就会特别焦虑——偏偏到处都还喜欢贩卖焦虑的时代里，你可以很容易的发现这样一件事实：写小众技术类书籍和写言情、穿越小说是完全不一样的。因为人家一天的销量能顶你三年。

龙马在基础篇40. 总结中留言：

基础篇看完了，晴空兄站从网站开发的全局视角编写本教程，可谓颇具匠心，能阅读到此教程，也是Drupaler之幸。感谢分享！

云客在司南讲Drupal8电子商务解决方案中留言：

很赞，具备开创性的资料，弥补了这一方面的空缺

晴空在司南讲Drupal8电子商务解决方案中留言：

非常宝贵的经验分享，谢谢司南！！

晴空在进阶篇9. 控制主题中的库及其加载的文件中留言：

我已经指导过了，本来想等楼上这位自己来总结的，但是他比我忙。

请大家记住，除非你在后台设置过，不然一般情况下你的网站的前端页面是由两个主题控制的，他们一个是前台主题，另一个是后台管理主题（一般是seven主题）。当管理员或者用户试图从前台添加节点时，就会自动使用管理主题。你可以在“外观”页面的最下方取消“当编辑和创建内容时使用管理化主题”这个选项来强制网站系统在前端只使用你写的主题。

本节所说的在主题中控制库的前提是这个主题被当前页面所启用。如果主题没有被启用，那你无法在这个没有被启用的主题中控制任何库。

具体过程我就不细说了，不管用的原因有两个：

第一、楼上加载css的时候没有用库，直接写到模板里了，这样做违背了Drupal的规范。上面说的操作库的方法，前提是你首先得有一个库。

第二、楼上在自己的前台主题中尝试去控制后台管理页面所加载的库。

这是行不通的。

这告诉我们，1.把基础概念搞清楚、2.保持思路清晰、3.仔细阅读文档，才是避免自己掉到坑里的不二法门。

晴空在基础篇8. 开启并创建settings.local.php文件中留言：

好多人都遇到过类似的问题，原因五花八门，总结下来就是不细心，以为自己按照教程操作了，但是其实在细节上有偏差。

排除错误的方法很简单，把所有的步骤全部重新做一遍，核对文件名、文件路径、清空缓存等。

其实你上面说的两句话，我都无法验证，是否“按照教程操作了”，你还得自己验证；

“没有生效”，这是个结论不是现象，你是如何得出的结论？

wow-yorick 在 65. 表单Form API中留言：

赞，感谢您的分享

云客在基础篇40. 总结中留言：

仔细看完了，写的很好，学习大多时候是为了造就有价值的产品，能站在项目层面考虑问题是很多人不具备的，人的能力有限协作才是方向，这是门学问