Stop the war!

Остановите войну!

for scientists:

default search action

combined dblp search
author search
venue search
publication search

ask others

Nitish Shirish Keskar

> Home > Persons

Person information

Refine list

refinements active!

zoomed in on ?? of ?? records

view refined list in

export refined list as

showing all ?? records

Journal Articles

see FAQ

What is the meaning of the colors in the publication lists?

2023
[j4]
- view
  - electronic edition @ openreview.net (open access)
  - no references & citations available
- export record
  dblp key:
  - journals/tmlr/SrivastavaRRSAF23
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/tmlr/SrivastavaRRSAF23
Aarohi Srivastava, Abhinav Rastogi, Abhishek Rao, Abu Awal Md Shoeb, Abubakar Abid, Adam Fisch, Adam R. Brown, Adam Santoro, Aditya Gupta, Adrià Garriga-Alonso, Agnieszka Kluska, Aitor Lewkowycz, Akshat Agarwal, Alethea Power, Alex Ray, Alex Warstadt, Alexander W. Kocurek, Ali Safaya, Ali Tazarv, Alice Xiang, Alicia Parrish, Allen Nie, Aman Hussain, Amanda Askell, Amanda Dsouza, Ambrose Slone, Ameet Rahane, Anantharaman S. Iyer, Anders Andreassen, Andrea Madotto, Andrea Santilli, Andreas Stuhlmüller, Andrew M. Dai, Andrew La, Andrew K. Lampinen, Andy Zou, Angela Jiang, Angelica Chen, Anh Vuong, Animesh Gupta, Anna Gottardi, Antonio Norelli, Anu Venkatesh, Arash Gholamidavoodi, Arfa Tabassum, Arul Menezes, Arun Kirubarajan, Asher Mullokandov, Ashish Sabharwal, Austin Herrick, Avia Efrat, Aykut Erdem, Ayla Karakas, B. Ryan Roberts, Bao Sheng Loe, Barret Zoph, Bartlomiej Bojanowski, Batuhan Özyurt, Behnam Hedayatnia, Behnam Neyshabur, Benjamin Inden, Benno Stein, Berk Ekmekci, Bill Yuchen Lin, Blake Howald, Bryan Orinion, Cameron Diao, Cameron Dour, Catherine Stinson, Cedrick Argueta, Cèsar Ferri Ramírez, Chandan Singh, Charles Rathkopf, Chenlin Meng, Chitta Baral, Chiyu Wu, Chris Callison-Burch, Chris Waites, Christian Voigt, Christopher D. Manning, Christopher Potts, Cindy Ramirez, Clara E. Rivera, Clemencia Siro, Colin Raffel, Courtney Ashcraft, Cristina Garbacea, Damien Sileo, Dan Garrette, Dan Hendrycks, Dan Kilman, Dan Roth, Daniel Freeman, Daniel Khashabi, Daniel Levy, Daniel Moseguí González, Danielle Perszyk, Danny Hernandez, Danqi Chen, Daphne Ippolito, Dar Gilboa, David Dohan, David Drakard, David Jurgens, Debajyoti Datta, Deep Ganguli, Denis Emelin, Denis Kleyko, Deniz Yuret, Derek Chen, Derek Tam, Dieuwke Hupkes, Diganta Misra, Dilyar Buzan, Dimitri Coelho Mollo, Diyi Yang, Dong-Ho Lee, Dylan Schrader, Ekaterina Shutova, Ekin Dogus Cubuk, Elad Segal, Eleanor Hagerman, Elizabeth Barnes, Elizabeth Donoway, Ellie Pavlick, Emanuele Rodolà, Emma Lam, Eric Chu, Eric Tang, Erkut Erdem, Ernie Chang, Ethan A. Chi, Ethan Dyer, Ethan J. Jerzak, Ethan Kim, Eunice Engefu Manyasi, Evgenii Zheltonozhskii, Fanyue Xia, Fatemeh Siar, Fernando Martínez-Plumed, Francesca Happé, François Chollet, Frieda Rong, Gaurav Mishra, Genta Indra Winata, Gerard de Melo, Germán Kruszewski, Giambattista Parascandolo, Giorgio Mariani, Gloria Wang, Gonzalo Jaimovitch-López, Gregor Betz, Guy Gur-Ari, Hana Galijasevic, Hannah Kim, Hannah Rashkin, Hannaneh Hajishirzi, Harsh Mehta, Hayden Bogar, Henry Shevlin, Hinrich Schütze, Hiromu Yakura, Hongming Zhang, Hugh Mee Wong, Ian Ng, Isaac Noble, Jaap Jumelet, Jack Geissinger, Jackson Kernion, Jacob Hilton, Jaehoon Lee, Jaime Fernández Fisac, James B. Simon, James Koppel, James Zheng, James Zou, Jan Kocon, Jana Thompson, Janelle Wingfield, Jared Kaplan, Jarema Radom, Jascha Sohl-Dickstein, Jason Phang, Jason Wei, Jason Yosinski, Jekaterina Novikova, Jelle Bosscher, Jennifer Marsh, Jeremy Kim, Jeroen Taal, Jesse H. Engel, Jesujoba Alabi, Jiacheng Xu, Jiaming Song, Jillian Tang, Joan Waweru, John Burden, John Miller, John U. Balis, Jonathan Batchelder, Jonathan Berant, Jörg Frohberg, Jos Rozen, José Hernández-Orallo, Joseph Boudeman, Joseph Guerr, Joseph Jones, Joshua B. Tenenbaum, Joshua S. Rule, Joyce Chua, Kamil Kanclerz, Karen Livescu, Karl Krauth, Karthik Gopalakrishnan, Katerina Ignatyeva, Katja Markert, Kaustubh D. Dhole, Kevin Gimpel, Kevin Omondi, Kory Mathewson, Kristen Chiafullo, Ksenia Shkaruta, Kumar Shridhar, Kyle McDonell, Kyle Richardson, Laria Reynolds, Leo Gao, Li Zhang, Liam Dugan, Lianhui Qin, Lidia Contreras Ochando, Louis-Philippe Morency, Luca Moschella, Lucas Lam, Lucy Noble, Ludwig Schmidt, Luheng He, Luis Oliveros Colón, Luke Metz, Lütfi Kerem Senel, Maarten Bosma, Maarten Sap, Maartje ter Hoeve, Maheen Farooqi, Manaal Faruqui, Mantas Mazeika, Marco Baturan, Marco Marelli, Marco Maru, María José Ramírez-Quintana, Marie Tolkiehn, Mario Giulianelli, Martha Lewis, Martin Potthast, Matthew L. Leavitt, Matthias Hagen, Mátyás Schubert, Medina Baitemirova, Melody Arnaud, Melvin McElrath, Michael A. Yee, Michael Cohen, Michael Gu, Michael I. Ivanitskiy, Michael Starritt, Michael Strube, Michal Swedrowski, Michele Bevilacqua, Michihiro Yasunaga, Mihir Kale, Mike Cain, Mimee Xu, Mirac Suzgun, Mitch Walker, Mo Tiwari, Mohit Bansal, Moin Aminnaseri, Mor Geva, Mozhdeh Gheini, Mukund Varma T., Nanyun Peng, Nathan A. Chi, Nayeon Lee, Neta Gur-Ari Krakover, Nicholas Cameron, Nicholas Roberts, Nick Doiron, Nicole Martinez, Nikita Nangia, Niklas Deckers, Niklas Muennighoff, Nitish Shirish Keskar, Niveditha Iyer, Noah Constant, Noah Fiedel, Nuan Wen, Oliver Zhang, Omar Agha, Omar Elbaghdadi, Omer Levy, Owain Evans, Pablo Antonio Moreno Casares, Parth Doshi, Pascale Fung, Paul Pu Liang, Paul Vicol, Pegah Alipoormolabashi, Peiyuan Liao, Percy Liang, Peter Chang, Peter Eckersley, Phu Mon Htut, Pinyu Hwang, Piotr Milkowski, Piyush Patil, Pouya Pezeshkpour, Priti Oli, Qiaozhu Mei, Qing Lyu, Qinlang Chen, Rabin Banjade, Rachel Etta Rudolph, Raefer Gabriel, Rahel Habacker, Ramon Risco, Raphaël Millière, Rhythm Garg, Richard Barnes, Rif A. Saurous, Riku Arakawa, Robbe Raymaekers, Robert Frank, Rohan Sikand, Roman Novak, Roman Sitelew, Ronan LeBras, Rosanne Liu, Rowan Jacobs, Rui Zhang, Ruslan Salakhutdinov, Ryan Chi, Ryan Lee, Ryan Stovall, Ryan Teehan, Rylan Yang, Sahib Singh, Saif M. Mohammad, Sajant Anand, Sam Dillavou, Sam Shleifer, Sam Wiseman, Samuel Gruetter, Samuel R. Bowman, Samuel S. Schoenholz, Sanghyun Han, Sanjeev Kwatra, Sarah A. Rous, Sarik Ghazarian, Sayan Ghosh, Sean Casey, Sebastian Bischoff, Sebastian Gehrmann, Sebastian Schuster, Sepideh Sadeghi, Shadi Hamdan, Sharon Zhou, Shashank Srivastava, Sherry Shi, Shikhar Singh, Shima Asaadi, Shixiang Shane Gu, Shubh Pachchigar, Shubham Toshniwal, Shyam Upadhyay, Shyamolima (Shammie) Debnath, Siamak Shakeri, Simon Thormeyer, Simone Melzi, Siva Reddy, Sneha Priscilla Makini, Soo-Hwan Lee, Spencer Torene, Sriharsha Hatwar, Stanislas Dehaene, Stefan Divic, Stefano Ermon, Stella Biderman, Stephanie Lin, Stephen Prasad, Steven T. Piantadosi, Stuart M. Shieber, Summer Misherghi, Svetlana Kiritchenko, Swaroop Mishra, Tal Linzen, Tal Schuster, Tao Li, Tao Yu, Tariq Ali, Tatsu Hashimoto, Te-Lin Wu, Théo Desbordes, Theodore Rothschild, Thomas Phan, Tianle Wang, Tiberius Nkinyili, Timo Schick, Timofei Kornev, Titus Tunduny, Tobias Gerstenberg, Trenton Chang, Trishala Neeraj, Tushar Khot, Tyler Shultz, Uri Shaham, Vedant Misra, Vera Demberg, Victoria Nyamai, Vikas Raunak, Vinay V. Ramasesh, Vinay Uday Prabhu, Vishakh Padmakumar, Vivek Srikumar, William Fedus, William Saunders, William Zhang, Wout Vossen, Xiang Ren, Xiaoyu Tong, Xinran Zhao, Xinyi Wu, Xudong Shen, Yadollah Yaghoobzadeh, Yair Lakretz, Yangqiu Song, Yasaman Bahri, Yejin Choi, Yichi Yang, Yiding Hao, Yifu Chen, Yonatan Belinkov, Yu Hou, Yufang Hou, Yuntao Bai, Zachary Seid, Zhuoye Zhao, Zijian Wang, Zijie J. Wang, Zirui Wang, Ziyi Wu:
Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models. Trans. Mach. Learn. Res. 2023 (2023)
2019
[j3]
- view
  authority control:
- export record
  dblp key:
  - journals/oms/KeskarW19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/oms/KeskarW19
Nitish Shirish Keskar, Andreas Wächter:
A limited-memory quasi-Newton algorithm for bound-constrained non-smooth optimization. Optim. Methods Softw. 34(1): 150-171 (2019)
[j2]
- view
  authority control:
- export record
  dblp key:
  - journals/tac/BerahasBKW19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/tac/BerahasBKW19
Albert S. Berahas, Raghu Bollapragada, Nitish Shirish Keskar, Ermin Wei:
Balancing Communication and Computation in Distributed Optimization. IEEE Trans. Autom. Control. 64(8): 3141-3155 (2019)
2016
[j1]
- view
  authority control:
- export record
  dblp key:
  - journals/oms/KeskarNOW16
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/oms/KeskarNOW16
Nitish Shirish Keskar, Jorge Nocedal, Figen Öztoprak, Andreas Wächter:
A second-order method for convex l₁-regularized optimization with active-set prediction. Optim. Methods Softw. 31(3): 605-621 (2016)

Conference and Workshop Papers

see FAQ

What is the meaning of the colors in the publication lists?

2022
[c16]
- view
  authority control:
- export record
  dblp key:
  - conf/acl/YavuzHZKX22
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/acl/YavuzHZKX22
Semih Yavuz, Kazuma Hashimoto, Yingbo Zhou, Nitish Shirish Keskar, Caiming Xiong:
Modeling Multi-hop Question Answering as Single Sequence Prediction. ACL (1) 2022: 974-990
2021
[c15]
- view
  authority control:
- export record
  dblp key:
  - conf/emnlp/AguilarMNRKS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/emnlp/AguilarMNRKS21
Gustavo Aguilar, Bryan McCann, Tong Niu, Nazneen Rajani, Nitish Shirish Keskar, Thamar Solorio:
Char2Subword: Extending the Subword Embedding Space Using Robust Character Compositionality. EMNLP (Findings) 2021: 1640-1651
[c14]
- view
  authority control:
- export record
  dblp key:
  - conf/emnlp/KrauseGMKJSR21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/emnlp/KrauseGMKJSR21
Ben Krause, Akhilesh Deepak Gotmare, Bryan McCann, Nitish Shirish Keskar, Shafiq R. Joty, Richard Socher, Nazneen Fatema Rajani:
GeDi: Generative Discriminator Guided Sequence Generation. EMNLP (Findings) 2021: 4929-4952
[c13]
- view
  authority control:
- export record
  dblp key:
  - conf/emnlp/NiuYZKWX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/emnlp/NiuYZKWX21
Tong Niu, Semih Yavuz, Yingbo Zhou, Nitish Shirish Keskar, Huan Wang, Caiming Xiong:
Unsupervised Paraphrasing with Pretrained Language Models. EMNLP (1) 2021: 5136-5150
[c12]
- view
  - electronic edition @ openreview.net (open access)
  - no references & citations available
- export record
  dblp key:
  - conf/iclr/BasuRKV21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/iclr/BasuRKV21
Sourya Basu, Govardana Sachitanandam Ramachandran, Nitish Shirish Keskar, Lav R. Varshney:
Mirostat: a Neural Text decoding Algorithm that directly controls perplexity. ICLR 2021
2020
[c11]
- view
  - electronic edition @ mlr.press (open access)
  - no references & citations available
- export record
  dblp key:
  - conf/aistats/WangKXS20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/aistats/WangKXS20
Huan Wang, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
Assessing Local Generalization Capability in Deep Models. AISTATS 2020: 2077-2087
[c10]
- view
  authority control:
- export record
  dblp key:
  - conf/emnlp/YavuzHLKSX20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/emnlp/YavuzHLKSX20
Semih Yavuz, Kazuma Hashimoto, Wenhao Liu, Nitish Shirish Keskar, Richard Socher, Caiming Xiong:
Simple Data Augmentation with the Mask Token Improves Domain Adaptation for Dialog Act Tagging. EMNLP (1) 2020: 5083-5089
[c9]
- view
  authority control:
- export record
  dblp key:
  - conf/emnlp/KeskarMXS20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/emnlp/KeskarMXS20
Nitish Shirish Keskar, Bryan McCann, Caiming Xiong, Richard Socher:
The Thieves on Sesame Street are Polyglots - Extracting Multilingual Models from Monolingual APIs. EMNLP (1) 2020: 6203-6207
[c8]
- view
  authority control:
- export record
  dblp key:
  - conf/ita/VarshneyKS20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/ita/VarshneyKS20
Lav R. Varshney, Nitish Shirish Keskar, Richard Socher:
Limits of Detecting Text Generated by Large-Scale Language Models. ITA 2020: 1-5
2019
[c7]
- view
  - electronic edition via DOI (open access)
  - references & citations
  authority control:
- export record
  dblp key:
  - conf/emnlp/KryscinskiKMXS19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/emnlp/KryscinskiKMXS19
Wojciech Kryscinski, Nitish Shirish Keskar, Bryan McCann, Caiming Xiong, Richard Socher:
Neural Text Summarization: A Critical Evaluation. EMNLP/IJCNLP (1) 2019: 540-551
[c6]
- view
  - electronic edition @ openreview.net (open access)
  - no references & citations available
- export record
  dblp key:
  - conf/iclr/GotmareKXS19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/iclr/GotmareKXS19
Akhilesh Gotmare, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
A Closer Look at Deep Learning Heuristics: Learning rate restarts, Warmup and Distillation. ICLR (Poster) 2019
[c5]
- view
  - electronic edition @ openreview.net (open access)
  - no references & citations available
- export record
  dblp key:
  - conf/iclr/ZhongXKS19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/iclr/ZhongXKS19
Victor Zhong, Caiming Xiong, Nitish Shirish Keskar, Richard Socher:
Coarse-grain Fine-grain Coattention Network for Multi-evidence Question Answering. ICLR (Poster) 2019
2018
[c4]
- view
  - electronic edition @ openreview.net (open access)
  - no references & citations available
- export record
  dblp key:
  - conf/iclr/MerityKS18
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/iclr/MerityKS18
Stephen Merity, Nitish Shirish Keskar, Richard Socher:
Regularizing and Optimizing LSTM Language Models. ICLR (Poster) 2018
2017
[c3]
- view
  - electronic edition @ openreview.net (open access)
  - no references & citations available
- export record
  dblp key:
  - conf/iclr/KeskarMNST17
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/iclr/KeskarMNST17
Nitish Shirish Keskar, Dheevatsa Mudigere, Jorge Nocedal, Mikhail Smelyanskiy, Ping Tak Peter Tang:
On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima. ICLR 2017
2016
[c2]
- view
  authority control:
- export record
  dblp key:
  - conf/pkdd/KeskarB16
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/pkdd/KeskarB16
Nitish Shirish Keskar, Albert S. Berahas:
adaQN: An Adaptive Quasi-Newton Algorithm for Training RNNs. ECML/PKDD (1) 2016: 1-16
2015
[c1]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/KeskarS15
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/KeskarS15
Nitish Shirish Keskar, George Saon:
A nonmonotone learning rate strategy for SGD training of deep neural networks. ICASSP 2015: 4974-4978

Informal and Other Publications

see FAQ

What is the meaning of the colors in the publication lists?

2022
[i28]
- view
  - electronic edition via DOI (open access)
  - references & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2205-09226
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2205-09226
Semih Yavuz, Kazuma Hashimoto, Yingbo Zhou, Nitish Shirish Keskar, Caiming Xiong:
Modeling Multi-hop Question Answering as Single Sequence Prediction. CoRR abs/2205.09226 (2022)
[i27]
- view
  - electronic edition via DOI (open access)
  - references & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2206-04615
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2206-04615
Aarohi Srivastava, Abhinav Rastogi, Abhishek Rao, Abu Awal Md Shoeb, Abubakar Abid, Adam Fisch, Adam R. Brown, Adam Santoro, Aditya Gupta, Adrià Garriga-Alonso, Agnieszka Kluska, Aitor Lewkowycz, Akshat Agarwal, Alethea Power, Alex Ray, Alex Warstadt, Alexander W. Kocurek, Ali Safaya, Ali Tazarv, Alice Xiang, Alicia Parrish, Allen Nie, Aman Hussain, Amanda Askell, Amanda Dsouza, Ambrose Slone, Ameet Rahane, Anantharaman S. Iyer, Anders Andreassen, Andrea Madotto, Andrea Santilli, Andreas Stuhlmüller, Andrew M. Dai, Andrew La, Andrew K. Lampinen, Andy Zou, Angela Jiang, Angelica Chen, Anh Vuong, Animesh Gupta, Anna Gottardi, Antonio Norelli, Anu Venkatesh, Arash Gholamidavoodi, Arfa Tabassum, Arul Menezes, Arun Kirubarajan, Asher Mullokandov, Ashish Sabharwal, Austin Herrick, Avia Efrat, Aykut Erdem, Ayla Karakas, B. Ryan Roberts, Bao Sheng Loe, Barret Zoph, Bartlomiej Bojanowski, Batuhan Özyurt, Behnam Hedayatnia, Behnam Neyshabur, Benjamin Inden, Benno Stein, Berk Ekmekci, Bill Yuchen Lin, Blake Howald, Bryan Orinion, Cameron Diao, Cameron Dour, Catherine Stinson, Cedrick Argueta, Cèsar Ferri Ramírez, Chandan Singh, Charles Rathkopf, Chenlin Meng, Chitta Baral, Chiyu Wu, Chris Callison-Burch, Chris Waites, Christian Voigt, Christopher D. Manning, Christopher Potts, Cindy Ramirez, Clara E. Rivera, Clemencia Siro, Colin Raffel, Courtney Ashcraft, Cristina Garbacea, Damien Sileo, Dan Garrette, Dan Hendrycks, Dan Kilman, Dan Roth, Daniel Freeman, Daniel Khashabi, Daniel Levy, Daniel Moseguí González, Danielle Perszyk, Danny Hernandez, Danqi Chen, Daphne Ippolito, Dar Gilboa, David Dohan, David Drakard, David Jurgens, Debajyoti Datta, Deep Ganguli, Denis Emelin, Denis Kleyko, Deniz Yuret, Derek Chen, Derek Tam, Dieuwke Hupkes, Diganta Misra, Dilyar Buzan, Dimitri Coelho Mollo, Diyi Yang, Dong-Ho Lee, Dylan Schrader, Ekaterina Shutova, Ekin Dogus Cubuk, Elad Segal, Eleanor Hagerman, Elizabeth Barnes, Elizabeth Donoway, Ellie Pavlick, Emanuele Rodolà, Emma Lam, Eric Chu, Eric Tang, Erkut Erdem, Ernie Chang, Ethan A. Chi, Ethan Dyer, Ethan J. Jerzak, Ethan Kim, Eunice Engefu Manyasi, Evgenii Zheltonozhskii, Fanyue Xia, Fatemeh Siar, Fernando Martínez-Plumed, Francesca Happé, François Chollet, Frieda Rong, Gaurav Mishra, Genta Indra Winata, Gerard de Melo, Germán Kruszewski, Giambattista Parascandolo, Giorgio Mariani, Gloria Wang, Gonzalo Jaimovitch-López, Gregor Betz, Guy Gur-Ari, Hana Galijasevic, Hannah Kim, Hannah Rashkin, Hannaneh Hajishirzi, Harsh Mehta, Hayden Bogar, Henry Shevlin, Hinrich Schütze, Hiromu Yakura, Hongming Zhang, Hugh Mee Wong, Ian Ng, Isaac Noble, Jaap Jumelet, Jack Geissinger, Jackson Kernion, Jacob Hilton, Jaehoon Lee, Jaime Fernández Fisac, James B. Simon, James Koppel, James Zheng, James Zou, Jan Kocon, Jana Thompson, Janelle Wingfield, Jared Kaplan, Jarema Radom, Jascha Sohl-Dickstein, Jason Phang, Jason Wei, Jason Yosinski, Jekaterina Novikova, Jelle Bosscher, Jennifer Marsh, Jeremy Kim, Jeroen Taal, Jesse H. Engel, Jesujoba Alabi, Jiacheng Xu, Jiaming Song, Jillian Tang, Joan Waweru, John Burden, John Miller, John U. Balis, Jonathan Batchelder, Jonathan Berant, Jörg Frohberg, Jos Rozen, José Hernández-Orallo, Joseph Boudeman, Joseph Guerr, Joseph Jones, Joshua B. Tenenbaum, Joshua S. Rule, Joyce Chua, Kamil Kanclerz, Karen Livescu, Karl Krauth, Karthik Gopalakrishnan, Katerina Ignatyeva, Katja Markert, Kaustubh D. Dhole, Kevin Gimpel, Kevin Omondi, Kory Mathewson, Kristen Chiafullo, Ksenia Shkaruta, Kumar Shridhar, Kyle McDonell, Kyle Richardson, Laria Reynolds, Leo Gao, Li Zhang, Liam Dugan, Lianhui Qin, Lidia Contreras Ochando, Louis-Philippe Morency, Luca Moschella, Lucas Lam, Lucy Noble, Ludwig Schmidt, Luheng He, Luis Oliveros Colón, Luke Metz, Lütfi Kerem Senel, Maarten Bosma, Maarten Sap, Maartje ter Hoeve, Maheen Farooqi, Manaal Faruqui, Mantas Mazeika, Marco Baturan, Marco Marelli, Marco Maru, María José Ramírez-Quintana, Marie Tolkiehn, Mario Giulianelli, Martha Lewis, Martin Potthast, Matthew L. Leavitt, Matthias Hagen, Mátyás Schubert, Medina Baitemirova, Melody Arnaud, Melvin McElrath, Michael A. Yee, Michael Cohen, Michael Gu, Michael I. Ivanitskiy, Michael Starritt, Michael Strube, Michal Swedrowski, Michele Bevilacqua, Michihiro Yasunaga, Mihir Kale, Mike Cain, Mimee Xu, Mirac Suzgun, Mitch Walker, Mo Tiwari, Mohit Bansal, Moin Aminnaseri, Mor Geva, Mozhdeh Gheini, Mukund Varma T., Nanyun Peng, Nathan A. Chi, Nayeon Lee, Neta Gur-Ari Krakover, Nicholas Cameron, Nicholas Roberts, Nick Doiron, Nicole Martinez, Nikita Nangia, Niklas Deckers, Niklas Muennighoff, Nitish Shirish Keskar, Niveditha Iyer, Noah Constant, Noah Fiedel, Nuan Wen, Oliver Zhang, Omar Agha, Omar Elbaghdadi, Omer Levy, Owain Evans, Pablo Antonio Moreno Casares, Parth Doshi, Pascale Fung, Paul Pu Liang, Paul Vicol, Pegah Alipoormolabashi, Peiyuan Liao, Percy Liang, Peter Chang, Peter Eckersley, Phu Mon Htut, Pinyu Hwang, Piotr Milkowski, Piyush Patil, Pouya Pezeshkpour, Priti Oli, Qiaozhu Mei, Qing Lyu, Qinlang Chen, Rabin Banjade, Rachel Etta Rudolph, Raefer Gabriel, Rahel Habacker, Ramon Risco, Raphaël Millière, Rhythm Garg, Richard Barnes, Rif A. Saurous, Riku Arakawa, Robbe Raymaekers, Robert Frank, Rohan Sikand, Roman Novak, Roman Sitelew, Ronan LeBras, Rosanne Liu, Rowan Jacobs, Rui Zhang, Ruslan Salakhutdinov, Ryan Chi, Ryan Lee, Ryan Stovall, Ryan Teehan, Rylan Yang, Sahib Singh, Saif M. Mohammad, Sajant Anand, Sam Dillavou, Sam Shleifer, Sam Wiseman, Samuel Gruetter, Samuel R. Bowman, Samuel S. Schoenholz, Sanghyun Han, Sanjeev Kwatra, Sarah A. Rous, Sarik Ghazarian, Sayan Ghosh, Sean Casey, Sebastian Bischoff, Sebastian Gehrmann, Sebastian Schuster, Sepideh Sadeghi, Shadi Hamdan, Sharon Zhou, Shashank Srivastava, Sherry Shi, Shikhar Singh, Shima Asaadi, Shixiang Shane Gu, Shubh Pachchigar, Shubham Toshniwal, Shyam Upadhyay, Shyamolima (Shammie) Debnath, Siamak Shakeri, Simon Thormeyer, Simone Melzi, Siva Reddy, Sneha Priscilla Makini, Soo-Hwan Lee, Spencer Torene, Sriharsha Hatwar, Stanislas Dehaene, Stefan Divic, Stefano Ermon, Stella Biderman, Stephanie Lin, Stephen Prasad, Steven T. Piantadosi, Stuart M. Shieber, Summer Misherghi, Svetlana Kiritchenko, Swaroop Mishra, Tal Linzen, Tal Schuster, Tao Li, Tao Yu, Tariq Ali, Tatsu Hashimoto, Te-Lin Wu, Théo Desbordes, Theodore Rothschild, Thomas Phan, Tianle Wang, Tiberius Nkinyili, Timo Schick, Timofei Kornev, Titus Tunduny, Tobias Gerstenberg, Trenton Chang, Trishala Neeraj, Tushar Khot, Tyler Shultz, Uri Shaham, Vedant Misra, Vera Demberg, Victoria Nyamai, Vikas Raunak, Vinay V. Ramasesh, Vinay Uday Prabhu, Vishakh Padmakumar, Vivek Srikumar, William Fedus, William Saunders, William Zhang, Wout Vossen, Xiang Ren, Xiaoyu Tong, Xinran Zhao, Xinyi Wu, Xudong Shen, Yadollah Yaghoobzadeh, Yair Lakretz, Yangqiu Song, Yasaman Bahri, Yejin Choi, Yichi Yang, Yiding Hao, Yifu Chen, Yonatan Belinkov, Yu Hou, Yufang Hou, Yuntao Bai, Zachary Seid, Zhuoye Zhao, Zijian Wang, Zijie J. Wang, Zirui Wang, Ziyi Wu:
Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models. CoRR abs/2206.04615 (2022)
[i26]
- view
  - electronic edition via DOI (open access)
  - references & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2208-03645
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2208-03645
Yongjun Chen, Jia Li, Zhiwei Liu, Nitish Shirish Keskar, Huan Wang, Julian J. McAuley, Caiming Xiong:
Generating Negative Samples for Sequential Recommendation. CoRR abs/2208.03645 (2022)
2021
[i25]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2111-10497
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2111-10497
Wenpeng Yin, Shelby Heinecke, Jia Li, Nitish Shirish Keskar, Michael Jones, Shouzhong Shi, Stanislav Georgiev, Kurt Milich, Joseph Esposito, Caiming Xiong:
Combining Data-driven Supervision with Human-in-the-loop Feedback for Entity Resolution. CoRR abs/2111.10497 (2021)
2020
[i24]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2002-03438
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2002-03438
Lav R. Varshney, Nitish Shirish Keskar, Richard Socher:
Limits of Detecting Text Generated by Large-Scale Language Models. CoRR abs/2002.03438 (2020)
[i23]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2003-13525
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2003-13525
Isabela Albuquerque, Nikhil Naik, Junnan Li, Nitish Shirish Keskar, Richard Socher:
Improving out-of-distribution generalization via multi-task self-supervised pretraining. CoRR abs/2003.13525 (2020)
[i22]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2004-03497
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2004-03497
Ali Madani, Bryan McCann, Nikhil Naik, Nitish Shirish Keskar, Namrata Anand, Raphael R. Eguchi, Po-Ssu Huang, Richard Socher:
ProGen: Language Modeling for Protein Generation. CoRR abs/2004.03497 (2020)
[i21]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2007-14966
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2007-14966
Sourya Basu, Govardana Sachitanandam Ramachandran, Nitish Shirish Keskar, Lav R. Varshney:
Mirostat: A Perplexity-Controlled Neural Text Decoding Algorithm. CoRR abs/2007.14966 (2020)
[i20]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2009-06367
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2009-06367
Ben Krause, Akhilesh Deepak Gotmare, Bryan McCann, Nitish Shirish Keskar, Shafiq R. Joty, Richard Socher, Nazneen Fatema Rajani:
GeDi: Generative Discriminator Guided Sequence Generation. CoRR abs/2009.06367 (2020)
[i19]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2010-12730
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2010-12730
Gustavo Aguilar, Bryan McCann, Tong Niu, Nazneen Fatema Rajani, Nitish Shirish Keskar, Thamar Solorio:
Char2Subword: Extending the Subword Embedding Space from Pre-trained Models Using Robust Character Compositionality. CoRR abs/2010.12730 (2020)
[i18]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-2010-12885
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2010-12885
Tong Niu, Semih Yavuz, Yingbo Zhou, Huan Wang, Nitish Shirish Keskar, Caiming Xiong:
Unsupervised Paraphrase Generation via Dynamic Blocking. CoRR abs/2010.12885 (2020)
2019
[i17]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1901-00603
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1901-00603
Victor Zhong, Caiming Xiong, Nitish Shirish Keskar, Richard Socher:
Coarse-grain Fine-grain Coattention Network for Multi-evidence Question Answering. CoRR abs/1901.00603 (2019)
[i16]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1904-09286
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1904-09286
Nitish Shirish Keskar, Bryan McCann, Caiming Xiong, Richard Socher:
Unifying Question Answering and Text Classification via Span Extraction. CoRR abs/1904.09286 (2019)
[i15]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1905-11471
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1905-11471
Jasdeep Singh, Bryan McCann, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
XLDA: Cross-Lingual Data Augmentation for Natural Language Inference and Question Answering. CoRR abs/1905.11471 (2019)
[i14]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1908-08960
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1908-08960
Wojciech Kryscinski, Nitish Shirish Keskar, Bryan McCann, Caiming Xiong, Richard Socher:
Neural Text Summarization: A Critical Evaluation. CoRR abs/1908.08960 (2019)
[i13]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1909-03290
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1909-03290
Lav R. Varshney, Nitish Shirish Keskar, Richard Socher:
Pretrained AI Models: Performativity, Mobility, and Change. CoRR abs/1909.03290 (2019)
[i12]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1909-05858
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1909-05858
Nitish Shirish Keskar, Bryan McCann, Lav R. Varshney, Caiming Xiong, Richard Socher:
CTRL: A Conditional Transformer Language Model for Controllable Generation. CoRR abs/1909.05858 (2019)
[i11]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1910-10245
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1910-10245
Ryan Theisen, Jason M. Klusowski, Huan Wang, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
Global Capacity Measures for Deep ReLU Networks via Path Sampling. CoRR abs/1910.10245 (2019)
2018
[i10]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1803-08240
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1803-08240
Stephen Merity, Nitish Shirish Keskar, Richard Socher:
An Analysis of Neural Language Modeling at Multiple Scales. CoRR abs/1803.08240 (2018)
[i9]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1806-06977
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1806-06977
Akhilesh Gotmare, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
Using Mode Connectivity for Loss Landscape Analysis. CoRR abs/1806.06977 (2018)
[i8]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1806-08730
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1806-08730
Bryan McCann, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
The Natural Language Decathlon: Multitask Learning as Question Answering. CoRR abs/1806.08730 (2018)
[i7]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1809-07402
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1809-07402
Huan Wang, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
Identifying Generalization Properties in Neural Networks. CoRR abs/1809.07402 (2018)
[i6]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1810-13243
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1810-13243
Akhilesh Gotmare, Nitish Shirish Keskar, Caiming Xiong, Richard Socher:
A Closer Look at Deep Learning Heuristics: Learning rate restarts, Warmup and Distillation. CoRR abs/1810.13243 (2018)
2017
[i5]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1708-02182
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1708-02182
Stephen Merity, Nitish Shirish Keskar, Richard Socher:
Regularizing and Optimizing LSTM Language Models. CoRR abs/1708.02182 (2017)
[i4]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1711-02132
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1711-02132
Karim Ahmed, Nitish Shirish Keskar, Richard Socher:
Weighted Transformer Network for Machine Translation. CoRR abs/1711.02132 (2017)
[i3]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/abs-1712-07628
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1712-07628
Nitish Shirish Keskar, Richard Socher:
Improving Generalization Performance by Switching from Adam to SGD. CoRR abs/1712.07628 (2017)
2016
[i2]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/KeskarMNST16
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/KeskarMNST16
Nitish Shirish Keskar, Dheevatsa Mudigere, Jorge Nocedal, Mikhail Smelyanskiy, Ping Tak Peter Tang:
On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima. CoRR abs/1609.04836 (2016)
2015
[i1]
- view
  - electronic edition @ arxiv.org (open access)
  - references & citations
- export record
  dblp key:
  - journals/corr/KeskarB15
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/KeskarB15
Nitish Shirish Keskar, Albert S. Berahas:
adaQN: An Adaptive Quasi-Newton Algorithm for Training RNNs. CoRR abs/1511.01169 (2015)

Coauthor Index

see FAQ

a service of

manage site settings

To protect your privacy, all features that rely on external API calls from your browser are turned off by default. You need to opt-in for them to become active. All settings here will be stored as cookies with your web browser. For more information see our F.A.Q.