Kaggle与职业发展:展示成果与寻找机会
立即解锁
发布时间: 2025-09-04 00:25:34 阅读量: 23 订阅数: 23 AIGC 


Kaggle竞赛实战指南
### Kaggle与职业发展:展示成果与寻找机会
#### 写作展示解决方案的优势
写作记录解决方案有独特的故事性优势。在写作时,需要为代码片段配上描述和解释,表述要比在笔记本中更详细。某种程度上,对工作的描述和所写的代码同样重要。通过调整写作风格,可以吸引不同类型的读者。用通俗易懂的方式阐述概念,能扩大受众群体,与更多专业人士建立联系;而采用高度技术性的写作方式,虽会限制读者数量,但可能会给潜在的招聘公司留下深刻印象。写作是非常个人化的行为,建议事先明确写作目的和目标受众。
#### GitHub的使用
- **代码复用**:除了撰写文章和拥有代码仓库引导读者外,将代码存于GitHub有助于避免在每次竞赛中重复造轮子。可以把想复用的代码存于项目或Gists(https://docs.github.com/en/github/writing-on-github/editing-and-sharing-content-with-gists )中,Gists是可单独访问的代码片段。若把所有代码留在Kaggle,随着时间推移,查找和访问会变得困难,因为Kaggle笔记本不能按项目分类,只能按投票数、最后运行时间等属性排序。而GitHub更便于查找和复用代码,例如可以创建包含所有代码的脚本,然后下载并导入到Kaggle笔记本中,无需复制粘贴。示例代码如下:
```python
!wget https://raw.githubusercontent.com/lmassaron/deep_learning_for_tabular_data/master/tabular.py
# Importing from Tabular
from tabular import gelu, Mish, mish
from tabular import TabularTransformer, DataGenerator
```
- **获取代码链接**:使用`wget`命令可直接访问GitHub上的代码并下载到笔记本磁盘,之后导入所需的函数和类。要获取直接访问代码的链接,只需在GitHub仓库中找到包含代码的文件,然后点击页面头部的“Raw”按钮,点击后会跳转到代码存储的网页地址,可在GitHub外部引用该文件。
- **存储图片**:GitHub还可用于存储在Kaggle讨论中使用的图片(Kaggle论坛已无法上传图片)。对于图片,没有“Raw”按钮,可右键点击图片,在新标签页中打开文件,效果相同。
- **展示工作**:GitHub是展示工作的好方式,但因其面向开发者且主要存储代码文件,受众通常是技术人员。公司的人力资源部门可能只会简单查看README.md文件,所以该文件要写得好且有视觉吸引力;招聘经理则更关注项目中的代码。为了让代码文件、程序和类结构良好,需要使用`conda`(https://docs.conda.io/en/latest/ )或`poetry`(https://python-poetry.org/ )等工具确保安装正确的包。使用`CookieCutter`(https://drivendata.github.io/cookiecutter-data-science/ )等模板能让项目代码更易排列到特定目录,便于理解和维护。
- **数据版本控制**:管理实验和数据源时,不仅代码需要版本控制,数据也需要,可使用Data Version Control(DVC:https://dvc.org/ )。这些资源和相关技能更偏向软件工程,在Kaggle上虽不是必需的,但掌握后能提升在GitHub上展示项目的能力,增加在面试中给人留下好印象的机会。
#### 模型实时演示的选择
- **原始笔记本或Google Colab**:最简单的方式是让代码在原始笔记本(在GitHub项目的README.md文件中添加Kaggle笔记本链接)或Google Colab上运行。要让存储在GitHub上的笔记本在Google Colab中自动运行,只需将链接中的`github.com`改为`githubtocolab.com`即可。
- **HuggingFace Spaces**:最令人印象深刻的展示方式是使用HuggingFace Spaces(https://huggingface.co/spaces )来演示Kaggle模型在在线应用中的使用。它可用于托管机器学习演示
0
0
复制全文
相关推荐









