顿悟|恩斯特
偶尔你会在研究的渣滓中发现好东西。最近出现了一篇密码破解论文,题目是使用 seq2seq 模型破解 1:1 替代密码。🙉
(1:1 替换是指密文代表目标明文中的固定字符。如果你喜欢危险的生活,在这里阅读更多。
现在使用的几种破译方法做了一个很大的假设。我们知道需要破解的密码的目标语言。但是,当潜入目标语言未知的加密历史文本时,当语言起源模糊不清时,你往往会感到非常头痛。
当一个人开始攻击加密文本时。密码的状态可以是各种条件:字母数字(数字/字母)或者它甚至可以是符号的或者它可以是两者的混合(像十二宫黑仔的密码👇).
然而,如果我们提前知道密码的明文语言是...说英语(而不是拉丁语,或任何其他语言),那么,我们有一个良好的开端和健康的优势。为什么?因为我们可以利用其他语言中没有的英语的独特特征。也就是说,字母“e”是英语中最常见的字母,所以密文中最常见的字母可能是字母“e ”,通过使用这些启发法,一个字母接一个字母地,你会慢慢变成达芬奇密码中的汤姆·汉克斯。
www3.nd.edu](https://www3.nd.edu/~busiforc/handouts/cryptography/letterfrequencies.html)
这篇 论文 真正有趣的地方在于,作者想要测试多语言 seq2seq 转换器是否能够在不知道明文语言来源的情况下破解密码。他们将解读公式化为一个序列到序列的翻译问题。该模型是在角色级别上训练的。
最酷的是,他们在历史密码(之前已被破解)上测试该模型,如博格密码,它能够以非常低的错误破解前 256 个字符。根据作者的说法,这是序列对序列神经模型首次应用于破译!
国安局就像…
解密的
如果你喜欢这本书,请给它一个👏👏并分享给你的朋友!这真的帮了我们大忙!
crypto.stackexchange.com](https://crypto.stackexchange.com/)
你可能已经听说过 OpenAI 本周的模型下降,所以我就不赘述了。添加了他们的两个博客,以防你想了解他们的情况。本周,我在 LinkedIn 上添加了用于 CLIP 的 Colab 笔记本,它获得了良好的反响,如果您感兴趣,我也将把它添加到这里:
colab.research.google.com](https://colab.research.google.com/github/openai/clip/blob/master/Interacting_with_CLIP.ipynb)
DALL-E 博客
openai.com](https://openai.com/blog/dall-e/)
剪辑博客
openai.com](https://openai.com/blog/clip/)
惊喜!有人已经在 PyTorch 上复制了 DALL-E😁。🔥🔥
pip install dalle-pytorch
github.com](https://github.com/lucidrains/DALLE-pytorch)
嘿,你知道当你设置你的 S3 桶或其他对象存储时,你可以选择公共或私人设置。你有没有想过,如果有人可以收集所有的公共桶网址供你公开搜索,那会是什么样子:👇
Ecco 库允许你可视化为什么语言模型以他们的方式运动。该库主要关注自回归模型(如 GPT-2/3 模型)。他们目前有两个笔记本来可视化神经元激活和输入显著性。
它建立在 PyTorch 和变形金刚之上。
www.eccox.io](https://www.eccox.io/) [## 解释转换器语言模型的接口
jalammar.github.io](https://jalammar.github.io/explaining-transformers/)
15.ai 于 2019 年推出了令人惊叹的文本到语音的演示,自那以来,它一直在完善其模型的功能。你可以输入文本并获得深度学习生成的语音,条件是从 2001:太空漫游的 HAL 9000 到神秘博士的各种字符。
[## 15.ai:使用最少数据的自然 TTS
15.ai](https://15.ai/)
谷歌推出了机器学习元数据(MLMD)。一个跟踪整个 ML 工作流程的库。允许您对您的模型和数据集进行版本化,以便您知道当它们出错时为什么会出错。
blog.tensorflow.org](https://blog.tensorflow.org/2021/01/ml-metadata-version-control-for-ml.html)
El GitHub:
github.com](https://github.com/google/ml-metadata)
MLDM API 等级:
[## mlmd .元数据 _ 存储。元数据存储| TFX |张量流
Wolfram 在左外野,他带了一部智能手机。在最近的一篇 Wolfram 博客文章中,他们展示了如何训练一个图像分类器,将其扔在 ONNX 上,然后将其转换为 Core ML,以便可以在 iOS 设备上使用。包含代码!
[## 使用 Wolfram 语言在你的 iOS 设备上部署一个神经网络
blog.wolfram.com](https://blog.wolfram.com/2021/01/07/deploy-a-neural-network-to-your-ios-device-using-the-wolfram-language/)
一个巨大的索引,每个索引有数百个关于机器学习的项目,包括计算机视觉和 NLP。你可以在上面找到超级骗子 NLP 回购😎。
[## ashishpatel 26/500-AI-机器学习-深度学习-计算机视觉-NLP-项目-带代码
github.com](https://github.com/ashishpatel26/500-AI-Machine-learning-Deep-learning-Computer-vision-NLP-Projects-with-code)
Ask2Transformers 自动注释文本数据..又名零距离射击。🔥
github.com](https://github.com/osainz59/Ask2Transformers)
一个参数有效的基于变压器的模型,结合了新提出的三明治式参数共享技术。
github.com](https://github.com/machelreid/subformer)
开放领域的 QA 评估库,它包括有效的读者比较,可重复的研究,以及应用程序的知识来源。
github.com](https://github.com/soco-ai/SF-QA)
阿拉伯语 BERT 连续第二周在 Cypher 上回归。这次是阿伯特和马伯特。它还包括基于 5 个不同任务的 41 个数据集的阿拉伯 NLU 基准 ArBench。
github.com](https://github.com/UBC-NLP/marbert)
CRSLab 是一个用于构建对话式推荐系统(CRS)的开源工具包。包括模型和数据集。
github.com](https://github.com/RUCAIBox/CRSLab)
“StrategyQA 是一个问答基准测试,专注于开放领域的问题,其中所需的推理步骤隐含在问题中,应该使用策略进行推理。StrategyQA 包括 2,780 个示例,每个示例由一个策略问题、其分解和证据段落组成。
例 1
"种植无籽黄瓜对有昆虫恐惧症的园丁有好处吗?"
答案:是的 解释:无籽黄瓜果实不需要授粉。黄瓜植物需要昆虫来授粉。昆虫恐惧症是对昆虫的恐惧。
例二
“龙猫是冷血动物吗?”
答案:没有 解释:龙猫是啮齿动物,是哺乳动物。所有的哺乳动物都是温血动物。
例 3
"珍妮·杰克逊会避免吃火腿菜吗?"
答案:是 解释:珍妮·杰克逊遵循一种伊斯兰惯例。伊斯兰文化避免吃猪肉。火腿是由猪肉制成的。
allenai.org](https://allenai.org/data/strategyqa)
每周日,我们都会对来自世界各地研究人员的 NLP 新闻和代码进行一次每周综述。
如需完整报道,请关注我们的 Twitter: @Quantum_Stat