Justme0 的博客

撷英采华,以备不需

字符编码小结

记得几年前有次需要写个简单的脚本,开始用的Python碰到中文编码问题,Python2和3还不一样,感觉比较复杂,后来不折腾了改用Ruby分分钟搞定,从那时就对Python没啥好感,至少没有Ruby开发效率高,Python以缩进表示层级有时也带来不便,其他语言可以用clang-format自动格式化,就能保持风格一致了。

Python在AI的生态很好,最近写这块程序碰到bytesstr转换时字符编码的问题,平常也时常碰到乱码的困惑,比如打开文件或者浏览网页乱码,尝试换一下编码就ok了,但是没有深究原理。这次彻底把字符编码弄清楚了。

下面说下常见的编码,ASCII, latin-1, Unicode, UTF-8(UTF-16/32),这几种在Python中常见。

WebRTC TURN 协议源码分析

WebRTC 是2011年谷歌开源的媒体框架,可以在浏览器中进行实时音视频通信,它是为P2P通信设计的,开发者也可以自己搭建服务器作为通信的一端。在下面这些网络条件限制严格的场景下不能直接建立通信,需要借助中转服务器TURN(Traversal Using Relays around NAT)转发。

  1. 一端是对称型NAT,另一端是端口限制锥形NAT或者也是对称型NAT,无法建立P2P。这个工具可以检测自己网络的NAT类型 https://github.com/aarant/pynat
  2. 对网络出口限制严格的环境,比如银行、政府单位,要求访问的外网IP地址需要加到其网关白名单。可以独立部署TURN服务器,将TURN的公网IP地址加到白名单。
  3. 对安全要求极端严格的防火墙,不允许UDP通信,甚至只允许TLS over 443端口的流量。(来源 https://security.stackexchange.com/a/196330

TURN 流程分析

协议分为三部分

  1. 在TURN服务器上创建传输资源,称为 allocation
  2. indication 方式传输数据
  3. channel 方式传输数据

要注意的是,这两种传输数据的方式是并列关系。三部分的流程时序图如下(可右键打开,放大查看文本格式),client参考WebRTC代码,server参考pion/turn代码。

【转】RTMP 协议规范

由于RTMP规范不在RFC官网上,为方便查看,转自 https://github.com/melpon/rfc/blob/master/rtmp.md,同 Adobe 官方标准 https://www.adobe.com/content/dam/acom/en/devnet/rtmp/pdf/rtmp_specification_1.0.pdf

Copyright Adobe Systems Incorporated                    H. Parmar, Ed.
                                                    M. Thornburgh, Ed.
                                                                 Adobe
                                                     December 21, 2012

Adobe’s Real Time Messaging Protocol

Abstract

This memo describes Adobe’s Real Time Messaging Protocol (RTMP), an application-level protocol designed for multiplexing and packetizing multimedia transport streams (such as audio, video, and interactive content) over a suitable transport protocol (such as TCP).

水垢

电水壶用了大半年,某天早晨起床后倒杯水,看到水中有一些杂质,开始以为是水质有问题,后来看了水壶中飘着一层薄膜状的东西,是烧水之后才出现的,水壶底和内壁上有一些刮痕状的东西,应该是水垢。回顾起中学化学的知识,查了一些资料,对水垢的来龙去脉做下记录,以后可以更好地处理生活上的问题。

水垢形成的主要过程

1, 空气中的$\ce{CO2}$与水结合形成$\ce{H2CO3}$,落到地面。

\[\ce{CO_2 +H_2O -> H_{2}CO_3}\]

建党100周年感想 —— 中国近现代史漫谈

今年是共产党建党一百周年,清明节去了趟毛主席纪念堂瞻仰伟人,献了三束白菊花,从毛主席侧边经过,过道大概离他两米距离,他安详地躺在玻璃水晶棺内,头发还是黑色的,身长比印象中小些。那会天安门广场就在紧锣密鼓地布置七一建党100周年纪念场地了。

音视频通信中 FEC 的数学原理

2021年6月重新整理后在部门做的分享 https://mp.weixin.qq.com/s/4dFdz0H0mjpemDflKbTdmQ

=============

FEC名为前向纠错(Forward Error Correction),用于恢复丢失的信息。看了很多介绍FEC的文章把矩阵和伽罗瓦域混在一块讲,大大提升了理解的难度。其实两者可以独立看待,我明白后有一种醍醐灌顶的感觉,伽罗瓦域(又名有限域)理论是连接连续数学和计算机落地实现时的桥梁,后文会详细说明。

本文分三部分介绍。

  1. 第一部分背景介绍,面向所有人,尽量讲解得通俗易懂,希望读者至少能看懂本文要解决什么问题。
  2. 第二部分面向学过高数的同学,讲解FEC怎么解方程来恢复数据的。
  3. 第三部分面向数学、计算机专业等学过群论的同学,讲解FEC在用计算机解方程时碰到的问题及如何用群论优美地解决的。


1. 背景介绍

大家用过微信的视频通话,有时网络不佳会感觉卡顿,视频是由“一幅幅图像”组成的(真实情况更复杂,这里为了降低理解的门槛简化说明),如果某一幅图像在传输过程中丢失接收者可能感觉卡顿。


微信通话

日本纪行

去日本游玩虽然过去两年了,时常回想起那儿的场景历历在目,仿佛发生在昨天。日本是个很有特色的国家,比如垃圾处理、XX、高度统一的衣着、别致的装修,很值得一去。

2018年5月26日下午和同事从深圳蛇口码头出发去香港机场,到日本凌晨3点,日本比中国早一个小时,在关西机场(大阪西边的一个岛上)的罗森店里买了个饭团填饱肚子,惊喜的是,看到了熟悉的“推荐使用支付宝”。在日本支付宝比微信支付普遍多了,可能是因为阿里有个软银爸爸在这吧,对了,在这边手机上网显示的电讯供应商就是“softbank”。在机场还看到了24小时的“中文”咨询台,可见来日本的中国游客多么多。

终于等到5点半,我们坐上了第一班去京都的地铁,这边叫JR(Japan Railway)线,与国内不同的是,日本是不分地铁与高铁的,轨道线从南到北贯穿日本,到城市里的话就入地下。经过这几天的见闻,给我的感觉是日本对自己的铁道历史和技术相当自豪,在大阪书店里看到好几排的铁道书籍、杂志、碟片,还有很多周边,比如著名的铁胆火车侠动画片,做成mini火车的筷子,印有火车侠的衣服等等,在京都还有专门的铁道博物馆。

大概7点半到京都,我们立刻去找早餐店,在街边找了半天也没找到合适的,京都街边的餐馆很少,后来才发现很多餐馆都在地下,最终我们还是在711买的早饭。这家711呢,有三个收银台,只有中间会