LoopyTech

Task Graph & Pandas-profiling

任务图与Pandas-profiling

Problem in Pandas-profiling I am recently very interested in Pandas-profiling and do contribute some codes (besides, it’s my first time to use Slack for collaborate). Simply speaking, Pandas-prof...

Considerations about OneHotEncoder

使用OneHotEncoder的一些注意事项

When I was answering questions on StackOverflow, I found this question interesting. I also found that there are lots of questions about sklearn.preprocessing.OneHotEncoder, which seemed to be pr...

knight-bus:Transport Python Objects from One Process(or computer) to Another

在不同设备(进程)间安全无损的传递Python对象

I build this package and you can visit code repository knight-bus Knight bus can safely and losslessly transport most of your python objects from one process(or computer) to another. The foll...

loopyCryptor:简洁的加解密Python对象

Encrypt & Decrypt Most Types of Python Objects

我制作了这个package,代码仓库可见 loopyCryptor 加密一切! loopyCryptor最近进入了0.1.0版本的时代,现在它具有了加密大部分python中对象的能力.它能够使用对称(AES)或非对称(RSA)的方式正常加解密以下类型的对象: None 布尔变量True和False 整数(int),长整数(long int),浮点数(float) ...

反编译"木兰编译器"并分析源码

Decompile "mulan" Compiler & Analyze it

本文所述实现,可见代码仓库: ulan-uncompile 大家都在说木兰编译器是在水项目,但我感觉很多人啥也不知道跟着黑,你随机抽样几个网友出来很有可能都解释不清楚Parser和lexer.所以我找到时间,拆开木兰编译器看看源码,是好是坏拆开看. (写在前面)结果是:我觉得:木兰编译器给python换了个前端,但至少不是我原来想的加了层贴纸(靠eval实现那种),所以算是一个挺...

一种回归决策树的快速遍历划分算法

A Fast Traversal Partition Algorithm for CART

本文所述算法改进实现见代码仓库: ML-Algorithm 本文描述了CART决策树的一种算法改进,能在基础的CART算法上提升样本数目倍的性能。同时也对该算法的理论依据进行了推导,实际效果进行了测试。 1. 问题的提出 众所周知,建立CART树有一个关键步骤:遍历数据空间中的所有划分界限,寻找最优切分特征$\alpha$与阈值$c$,以最小化分出的两个集合的方差,也就...

一种基于mips整数指令的小数进制转换算法

A Decimal to Binary Float Conversion Algorithm Based on MIPS Integer Instructions

问题的提出 我的计算机组成原理课程设计需要完全使用非浮点数指令来完成一个IEEE754标准的小数存储和计算,其中关于二进制转十进制小数的部分比较困难,查询资料也无果,于是我提出了这个算法,它的特点在于: 不使用浮点指令 算法中的所有变量都只能存储于32位的寄存器中 每读取一位小数,就将这位小数的信息表达到结果中,避免内存消耗 算法思路 这个算法基于上面特点中的第三条...

pymips:A Mips Simulator

编译,反编译和运行mips源码

I build this package with some of my friends, you can see code repository pymips Build a MIPS-simulator Introduction MIPS-Simulator runs MIPS32 programs. Unlike real simulator, which asse...

使用爬虫来批量下载明星的大量(公开的)音视频资源

Batch download audio-visual resources

用了很久Python,没怎么写过爬虫,最近看见我收藏夹里的一些视频悄无声息的失效了,歌也版权限定了,我决定学下爬虫,把音视频资源都下载下来自己保存。 发现其实挺简单的,想个办法批量的下载,然后就和数据挖掘比赛里清洗数据的操作差不多了。 1.找来源 显然,第一步是找到音视频资源的来源。根据平时“网上冲浪”的经验,我瞄准了三个主要来源: B站:视频质量比较高,但相对来说视频资源比较松...

Mathematics of a Model Predicting Happiness

Fisher假设检验方法用于多分类问题评分的思考

也可参见本文的jupyter发布版本,Github仓库,或可在线运行的平台:online-playground,天池实验室 Fisher假设检验方法用于多分类问题评分的思考 一. 问题的发现 在阿里天池的幸福感预测比赛(实质上是个多分类预测问题)中,使用到了均方误差(MSE)评分的办法。我发现MSE虽然能表征预测结果的有效性,但实际上存在一个漏洞。 考虑一个测试集,将其...