LoopyTech

使用爬虫来批量下载明星的大量(公开的)音视频资源

Batch download audio-visual resources

用了很久Python,没怎么写过爬虫,最近看见我收藏夹里的一些视频悄无声息的失效了,歌也版权限定了,我决定学下爬虫,把音视频资源都下载下来自己保存。 发现其实挺简单的,想个办法批量的下载,然后就和数据挖掘比赛里清洗数据的操作差不多了。 ## 1.找来源 显然,第一步是找到音视频资源的来源。根据平时“网上冲浪”的经验,我瞄准了三个主要来源: - B站:视频质量比较高,但相对来说视频资源...

Mathematics of a Model Predicting Happiness

Fisher假设检验方法用于多分类问题评分的思考

> 也可参见本文的[jupyter发布版本](http://file.loopy.tech/release/FisherScore.html),[Github仓库](https://github.com/loopyme/AliTianChi/blob/master/多分类_幸福度/Fisher假设检验方法用于多分类问题评分的思考.ipynb),或可在线运行的平台:[online-pl...

假设空间与版本空间生成器

基于python

> 代码仓库: [Watermelon-book-puzzles](https://github.com/CQU-AI/Watermelon-book-puzzles/tree/master/Chapter-1) ## 假设空间-样本空间-版本空间自动生成器 生成器的结构 ``` py class DatasetSpace: """ Automatically gener...

画像周志华教授的研究兴趣

使用Jupyter notebook

本文从[周志华教授的简历网站](https://cs.nju.edu.cn/zhouzh/)出发,收集周教授的研究兴趣相关数据,并进行分析画像。 > 本文档为文字版本,若需查看带源码的notebook,请前往[此处](http://file.loopy.tech/share/zzh-portrait.html) ## A. 概览 > 简历网站首页: I have wide researc...

制作一个文件下载器

python-flask文件中转站:用于下载"不可下载"的文件

> 代码仓库: [file_bridge](https://github.com/loopyme/online-tools/blob/master/file_bridge) > 食用地址:191.96.25.161:8080 由于某些原因,我关闭了自己的ssr(就是胆子小),但某些下载需求仍是存在的,比如一些没有国内镜像的软件包,研究用数据集等等.今天就是为了解决这个下载问题: ## 大...

成为Sklearn中文文档项目的贡献者!

apachecn/scikit-learn-doc-zh

> 代码仓库: [apachecn/sklearn-doc-zh](https://gihub.com/apachecn/sklearn-doc-zh) 这是一个为开源做贡献的好机会:参与Sklearn中文文档的翻译与维护。 首先,为了证明这个Sklearn中文文档是流行的,请使用你的搜索引擎搜索“Sklearn 文档”,看看你是不是也找到的是[这个](http://sklearn...

使用正则调整文章格式

python-re

## 问题 [Sklearn中文文档](https://github.com/apachecn/scikit-learn-doc-zh)的仓库里有大量公式被标记为了python代码段.导致网页上出现了这样: ![bug.png][bugstr] ## 解决 用一个脚本把所有的错误标记删掉就好了: ```python import re import os def remove_mar...

工业蒸汽量回归预测

阿里天池比赛持续记录

# 工业蒸汽量回归预测 我就不把notebook转码成md发到日志里了,代码见[GitHub仓库](https://github.com/loopyme/AliTianChi)或[天池实验室](https://tianchi.aliyun.com/home/science/scienceDetail?spm=5176.12282024.0.0.21932658B0KVpQ&userId=1...

只要数据洗得好,随机森林都能跑

阿里天池新手赛:多分类预测幸福

## 数据探索 今天,我主要完成了EDA(探索式数据分析)和可视化 (顺路把数据洗一洗) 然后想试一下数据好点没有,就用随机森林跑了一下,MSE = 0.489 暂时(201905102000)rank=56 果然只要数据洗得好,随机森林都能跑 等我有空了换个模型来跑一下 完整的notebook我已经在阿里天池讨论区上公开了:https://tianchi.aliyun.com/n...

制作一个在线人脸检测工具

基于Flask和BaiduAPI

> 食用地址: http://face.loopy.tech 实现路径是: - **使用flask_uploads来上传图片** - **设置上传图片存储位置**:config['UPLOADED_PHOTOS_DEST'] - **文件类型过滤**:创建一个set(UploadSet()类),然后使用configure_uploads()方法注册并完成相应的配置 ...