我研究自动驾驶汽车怎么认路。汽车自己开需要看清周围。它必须知道哪里是路哪里是树。它必须知道前面是车还是人。我的论文就是解决这个“看清”的问题。
现在的汽车有很多眼睛。这些眼睛就是传感器。有摄像头。有激光雷达。激光雷达像蝙蝠一样用激光测距离。这些眼睛看到很多东西。东西太多太乱了。汽车电脑会糊涂。它不知道哪个东西重要。我的工作就是帮汽车整理看到的信息。我把乱糟糟的信息变成一张清楚的地图。
第一步是认识东西。摄像头拍到一张图。图里有各种形状和颜色。电脑需要知道这些形状是什么。一个方盒子在动可能是汽车。一个细长的形状可能是电线杆。我让电脑学习认识这些东西。我用了很多很多图片训练电脑。图片里标好了哪里是汽车哪里是人。电脑看多了就学会了。它看到新图片就能找出里面的汽车和人。这就像教小孩认东西。
只认识还不行。还得知道东西在哪里。光靠摄像头不够。摄像头不知道距离。激光雷达知道距离但看不清细节。我把它们结合起来。摄像头告诉我前面有个东西是车。激光雷达告诉我那辆车离我们二十米。这样信息就完整了。我知道那是什么也知道它在哪里。我把这个过程做得又快又准。汽车开车很快,不能慢慢算。
路上的情况一直在变。汽车自己在动。别的车也在动。我需要猜这些东西下一秒钟在哪里。这很难。一个人可能突然跑过马路。旁边的车可能突然刹车。我设计了一个方法。这个方法看东西过去怎么动。然后猜它接下来会怎么动。比如一辆车一直直走,它很可能继续直走。一个人站在路边看手机,他可能突然走上马路。我给电脑很多例子学习。电脑慢慢学会了猜得更准。
汽车认路不能只靠眼睛。还需要知道地图。地图告诉汽车大路在哪里小路在哪里。但地图是旧的。路上可能有新修的路或者临时封路。我把眼睛看到的新信息和旧地图放在一起。汽车一边看路一边更新脑子里的地图。这样它就知道现在真实的路况。它知道哪里可以走哪里不能走。
所有这些信息最后要变成一个决定。汽车看到前面五十米有个人在过马路。左边有车。右边是护栏。汽车必须决定怎么做。是刹车还是绕开。我帮电脑把看到的情况变成几个简单的选择。电脑根据安全规则选最安全的那一个。我的研究让电脑更清楚看到情况。这样它的决定就更安全。
做研究的时候我遇到很多困难。电脑有时候认错东西。它把一条大狗认成小孩。这很危险。我找了更多狗的图片和小孩的图片给电脑学习。电脑学多了就分得清了。下雨天摄像头看不清。激光雷达也被雨点干扰。我研究了雨天的数据特点。我教电脑区分雨点和真正的障碍物。晚上灯光暗认东西更难。我调整了电脑看图片的方法。让它能在暗光下也能看清轮廓。
这个研究用了很多数学和程序。但目的很简单。就是让汽车像好司机一样看清路。一个好司机眼睛好反应快。我希望自动驾驶汽车也有这样的好眼睛。我做了很多实验。在电脑里模拟各种路况。也在真实的测试车上试过。一次一次改进。现在系统认东西更准了。反应也更快了。
自动驾驶是未来的方向。它能减少事故。它能帮助不会开车的人。但前提是它必须安全。安全的第一步就是看清世界。我的论文就是为这个目标做了一点点工作。我把不同的传感器信息更好地融合在一起。我让电脑更能理解移动的东西要干什么。我让汽车更懂得它所处的环境。
这项技术不光能用于开车。还能用在其他地方。比如工厂里的机器人。它需要看清零件在哪里。比如帮助盲人的机器。它需要看清路上的障碍。我的研究方法对这些也有用。核心是一样的。让机器看懂周围世界。然后做出合适的动作。
研究过程中我学到很多东西。我明白了把一个想法变成实际系统有多难。需要考虑无数细节。一个小的错误可能让整个系统出错。需要反复测试反复修改。我也看到了技术的进步。一年前觉得很难的问题。现在有了新的解决方法。这个领域发展很快。
我的论文只是一个开始。还有很多问题没解决。比如大雾天气怎么办。比如遇到从来没见过的奇怪车辆怎么办。比如怎么理解交警的手势。这些都需要继续研究。我希望以后的研究者能接着做下去。让机器的眼睛越来越亮。让自动驾驶越来越安全。让这项技术真正造福大家的生活。开车是很多人每天都要做的事。如果有一天机器能开得又好又安全。人们就能在车里休息或者工作。那会是很不一样的体验。我的研究是为这个未来添一块砖。