加载中...

跳转到内容
返回

在人工智能训练中踩过的一些坑

发布:
字数:
180
阅读时长:
1 分钟

正文

我来氵一篇文章(作业没写完,但是一点也不想写了…)

我踩的坑

  • 没有配置类似 Tensorflow 的 AI 训练进度监视
  • 没有开启类似 Screen 的 Linux 终端窗口管理工具,导致 SSH 关闭后训练任务直接终结(还烧了我一晚上的费用…)
  • 开始训练时没有配置好训练参数,导致训练的效果十分微妙…

一些建议

  • 不要使用你的物理机去跑模型,去花点钱租一个服务器吧
  • 训练时使用 conda 这样的 python 环境管理工具会比较方便
  • 先跑一些简单的模型练练手,然后再跑大一点的模型吧

在以下平台分享这篇帖子: